Apr, 2023

学习视频问答的情境超图

TL;DR本研究提出了一种基于情境超图的视频问答(SHG-VQA)架构,通过训练超图解码器来预测情境超图,并使用超图和问题嵌入的交叉注意力来预测正确答案,结果表明,学习底层情境超图可以显著提高系统对于视频问答任务的新型挑战的性能。