Review | Views : 0 下载量: 183 CSCD: 0
  • Export

  • Share

  • Collection

  • Album

    • Video question answering with large language models: a survey

    • In the field of natural language processing, significant progress has been made in large language models, but challenges still exist in the field of video question answering. This article systematically reviews the research progress of video question answering models, providing new ideas for the development of multimodal artificial intelligence.
    • Vol. 30, Issue 12, Pages: 3760-3781(2025)   

      Received:06 September 2024

      Revised:2025-04-20

      Accepted:10 June 2025

      Published:16 December 2025

    • DOI: 10.11834/jig.240535     

    移动端阅览

  • Xie Junlin, Zhang Ruifei, Li Guanbin. 2025. Video question answering with large language models: a survey. Journal of Image and Graphics, 30(12):3760-3781 DOI: 10.11834/jig.240535.
  •  
  •  
Alert me when the article has been cited
提交

相关作者

Xie Junlin 香港中文大学
Zhang Ruifei 香港中文大学
Li Guanbin 中山大学
Cao Jianfeng 北京航天飞行控制中心
Miao Shilin 北京交通大学计算机科学与技术学院信息科学研究所;北京交通大学计算机科学与技术学院视觉智能交叉 创新教育部国际合作联合实验室
Tang Yepeng 北京交通大学计算机科学与技术学院信息科学研究所;北京交通大学计算机科学与技术学院视觉智能交叉 创新教育部国际合作联合实验室
Zhang Chunjie 北京交通大学计算机科学与技术学院信息科学研究所;北京交通大学计算机科学与技术学院视觉智能交叉 创新教育部国际合作联合实验室
Liu Chunkai 北京航天飞行控制中心;航天飞行动力学技术重点实验室;江西理工大学电气工程与自动化学院

相关机构

Sun Yat-sen University
The Chinese University of Hong Kong
School of Electrical Engineering and Automation, Jiangxi University of Science and Technology
National Key Laboratory of Aerospace Flight Dynamics
Beijing Aerospace Control Center
0