Multimedia Analysis and Understanding | Views : 0 下载量: 0 CSCD: 0
  • Export

  • Share

  • Collection

  • Album

    • Knowledge-representation-enhanced multimodal Transformer for scene text visual question answering

    • Vol. 27, Issue 9, Pages: 2761-2774(2022)   

      Published: 16 September 2022

      Accepted: 08 June 2022

    • DOI: 10.11834/jig.211213     

    移动端阅览

  • Zhou Yu, Jun Yu, Junjie Zhu, Zhenzhong Kuang. Knowledge-representation-enhanced multimodal Transformer for scene text visual question answering. [J]. Journal of Image and Graphics 27(9):2761-2774(2022) DOI: 10.11834/jig.211213.
  •  
  •  
Alert me when the article has been cited
提交

相关作者

Bi Xiuping 武汉大学计算机学院国家多媒体软件工程技术研究中心
Chen Shi 武汉大学计算机学院国家多媒体软件工程技术研究中心
Zhang Lefei 武汉大学计算机学院国家多媒体软件工程技术研究中心;湖北珞珈实验室
Jiang Ting 四川师范大学计算机科学学院;吉利学院智能科技学院
Li Xiaoning 四川师范大学计算机科学学院;可视化计算与虚拟现实四川省重点实验室
Sun Meiting 南京理工大学计算机科学与工程学院
Dai Longquan 南京理工大学计算机科学与工程学院
Tang Jinhui 南京理工大学计算机科学与工程学院

相关机构

National Engineering Research Center for Multimedia Software, School of Computer Science, Wuhan University
Hubei Luojia Laboratory
College of Computer Science, Sichuan Normal University
College of Intelligent Science and Technology, Geely University
Visual Computing and Virtual Reality Key Laboratory of Sichuan Province
0