文字多模态大模型 | 浏览量 : 0
下载量:
523
CSCD:
0
TextLLM:基于动态分辨率的文档多模态大模型
TextLLM: a document multimodal large model based on dynamic resolution
- “最新研究突破,提出了基于动态分辨率的文档多模态大模型TextLLM,无需OCR工具即可处理高分辨率文档图像,显著提升了文档理解性能。”
- 2025年30卷第9期 页码:3068-3082
收稿:2024-10-16,
修回:2025-01-17,
录用:2025-02-18,
纸质出版:2025-09-16
DOI: 10.11834/jig.240608
移动端阅览
