信息解耦式自监督预训练语音大模型

视觉及多模态大模型 | 浏览量 : 0 下载量: 114 CSCD: 0

PDF
导出
分享
收藏
专辑

信息解耦式自监督预训练语音大模型
Information disentanglement-based self-supervised learning speech pretrained large model
“在语音交互领域，专家提出了基于语音信息解耦策略的预训练大模型，有效提升了模型对语音信息的解析与重构能力，为言语交互大模型提供了新的研究视角与实用工具。”
2025年30卷第5期页码：1272-1285
收稿日期：2024-12-31，

修回日期：2025-02-23，

纸质出版日期：2025-05-16
DOI： 10.11834/jig.240607
稿件说明：

移动端阅览

王龙标，江宇，王天锐，王晓宝，党建武. 2025. 信息解耦式自监督预训练语音大模型. 中国图象图形学报， 30(5):1272-1285 DOI： 10.11834/jig.240607.

Wang Longbiao， Jiang Yu， Wang Tianrui， Wang Xiaobao， Dang Jianwu. 2025. Information disentanglement-based self-supervised learning speech pretrained large model. Journal of Image and Graphics， 30(5):1272-1285 DOI： 10.11834/jig.240607.

文章被引用时，请邮件提醒。

提交

相关文章

一致性约束引导的零样本三维模型分类网络

视觉基础模型研究现状与发展趋势

自监督提取光谱序列和语义信息的胆管癌显微高光谱图像分类

语音深度伪造及其检测技术研究进展

相关作者

王龙标天津大学智能与计算学部认知计算与应用重点实验室

江宇天津大学智能与计算学部认知计算与应用重点实验室

王天锐天津大学智能与计算学部认知计算与应用重点实验室

王晓宝天津大学智能与计算学部认知计算与应用重点实验室

党建武中国科学院深圳先进技术研究院

郑虎北方民族大学计算机科学与工程学院

晏浩北方民族大学计算机科学与工程学院

白静北方民族大学计算机科学与工程学院;国家民委图像图形智能处理实验室

相关机构

北方民族大学计算机科学与工程学院

国家民委图像图形智能处理实验室

中移（苏州）软件技术有限公司平台产品部

北京大学计算机学院

湖南大学电气与信息工程学院

地址：北京市海淀区北四环西路19号中科院电子所主楼223室邮编：100190
联系电话：010-58887035/58887030/58887418 Email：jig@aircas.ac.cn
技术支持由北京北大方正电子有限公司提供京ICP备05080539号-4 京公网安备11010802024621
本系统建议在Chrome、 IE9+ 以上版本浏览器阅读本站内容，360浏览器请切换至极速模式
Cookies帮助我们提供服务并提供个性化体验。使用本网站，即表示您同意我们使用Cookies

⁰