ICCVJul, 2021

动态场景图生成的时空变换器

TL;DR本文提出了一种基于空间 - 时间变换器 (STTran) 的神经网络,用于生成给定视频的动态场景图。STTran 包括一个空间编码器和一个时间解码器,能够有效地捕捉对象之间的视觉关系和帧之间的时间依赖。与已有方法相比,我们的方法在 Action Genome 数据集上表现出了更好的性能。