Jun, 2022

CVPR 2022 LOVEU AQTC 挑战赛技术报告

TL;DR本文介绍了第二个获胜的AQTC模型,该模型通过提出一种新的上下文地面模块注意力机制来解决视频中多步答案、多模态和各种不同和变化的按钮表示等方面的困难,并对不同步骤网络和视频特征进行了消融研究和按钮数量分析,其在LOVEU竞赛轨道3中取得了总体第二名的成绩,并在四个评估指标中的两个指标中获得了第一名。