视觉及多模态大模型 | 浏览量 : 0 下载量: 114 CSCD: 0
  • 导出

  • 分享

  • 收藏

  • 专辑

    • 信息解耦式自监督预训练语音大模型

    • Information disentanglement-based self-supervised learning speech pretrained large model

    • 在语音交互领域,专家提出了基于语音信息解耦策略的预训练大模型,有效提升了模型对语音信息的解析与重构能力,为言语交互大模型提供了新的研究视角与实用工具。
    • 2025年30卷第5期 页码:1272-1285   

      收稿日期:2024-12-31

      修回日期:2025-02-23

      纸质出版日期:2025-05-16

    • DOI: 10.11834/jig.240607     

    移动端阅览

  • 王龙标, 江宇, 王天锐, 王晓宝, 党建武. 2025. 信息解耦式自监督预训练语音大模型. 中国图象图形学报, 30(5):1272-1285 DOI: 10.11834/jig.240607.
    Wang Longbiao, Jiang Yu, Wang Tianrui, Wang Xiaobao, Dang Jianwu. 2025. Information disentanglement-based self-supervised learning speech pretrained large model. Journal of Image and Graphics, 30(5):1272-1285 DOI: 10.11834/jig.240607.
  •  
  •  
文章被引用时,请邮件提醒。
提交

相关作者

王龙标 天津大学智能与计算学部认知计算与应用重点实验室
江宇 天津大学智能与计算学部认知计算与应用重点实验室
王天锐 天津大学智能与计算学部认知计算与应用重点实验室
王晓宝 天津大学智能与计算学部认知计算与应用重点实验室
党建武 中国科学院深圳先进技术研究院
郑虎 北方民族大学计算机科学与工程学院
晏浩 北方民族大学计算机科学与工程学院
白静 北方民族大学计算机科学与工程学院;国家民委图像图形智能处理实验室

相关机构

北方民族大学计算机科学与工程学院
国家民委图像图形智能处理实验室
中移(苏州)软件技术有限公司平台产品部
北京大学计算机学院
湖南大学电气与信息工程学院
0