ICCVSep, 2019

通过时空图推理理解人类凝视交流

TL;DR为了研究人类社交互动,本文提出了一个新问题,即如何在社交视频中理解人类注视交流。为解决这个问题,作者贡献了一个大规模视频数据集 “VACATION”,并提出了一个时空图神经网络来处理社交场景中的注视交互,以及一个编码器 — 解码器架构的事件网络来预测分子层面和事件层面的注视交流。实验表明,这个模型显著提高了各种基线模型在预测分子层面和事件层面的注视交流方面的表现。