Oct, 2022

EgoTaskQA:理解自我中心视频中的人类任务

TL;DR通过问题回答对现实生活中的个人行为视频进行对话式任务理解,以制定 EgoTaskQA 基准,并在其中对最先进的视频推理模型进行评估,以此引导视觉界朝着面向目标的视频理解和推理的方向前进。