三维视觉与SLAM | 浏览量 : 0 下载量: 6620 CSCD: 0
  • 导出

  • 分享

  • 收藏

  • 专辑

    • 多模态大模型驱动的三维视觉理解技术前沿进展

    • Advancements in 3D vision understanding using multimodal large language models

    • 三维视觉感知和理解在机器人导航、自动驾驶等领域取得重大进展,多模态大模型融合3D数据展现独特优势,为空间智能领域发展铺平道路。
    • 2025年30卷第6期 页码:1744-1791   

      收稿:2024-09-29

      修回:2024-12-22

      纸质出版:2025-06-16

    • DOI: 10.11834/jig.240588     

    移动端阅览

  • 冯明涛, 沈军豪, 武子杰, 彭伟星, 钟杭, 郭裕兰, 舒祥波, 张辉, 董伟生, 王耀南. 2025. 多模态大模型驱动的三维视觉理解技术前沿进展. 中国图象图形学报, 30(6):1744-1791 DOI: 10.11834/jig.240588.
    Feng Mingtao, Shen Junhao, Wu Zijie, Peng Weixing, Zhong Hang, Guo Yulan, Shu Xiangbo, Zhang Hui, Dong Weisheng, Wang Yaonan. 2025. Advancements in 3D vision understanding using multimodal large language models. Journal of Image and Graphics, 30(6):1744-1791 DOI: 10.11834/jig.240588.
  •  
  •  
文章被引用时,请邮件提醒。
提交

相关作者

冯明涛 西安电子科技大学
沈军豪 西安电子科技大学
武子杰 湖南大学
彭伟星 湖南大学
钟杭 湖南大学
郭裕兰 国防科技大学
舒祥波 南京理工大学
张辉 湖南大学

相关机构

国防科技大学
清华大学自动化系
加州大学圣迭戈分校计算机科学与工程系
中国科学院计算技术研究所
北京大学智能学院
0