文字多模态大模型 | 浏览量 : 0
下载量:
562
CSCD:
0
多模态大模型面向电子文档视觉问答的数据生成
Multimodal large model-based method for generating visual Q&A data for electronic document images
- “最新研究突破了电子文档视觉问答数据生成技术,显著提升了多模态大型语言模型的文档阅读性能。”
- 2025年30卷第9期 页码:3083-3096
收稿:2024-10-16,
修回:2025-02-16,
录用:2025-02-25,
纸质出版:2025-09-16
DOI: 10.11834/jig.240610
移动端阅览
