May, 2024

基于有向 Gromov-Wasserstein 差异的多视角动作识别

TL;DR我们提出了一种多视角注意力一致性方法,使用有向Gromov-Wasserstein差异计算来自行动视频的两个不同视角的注意力之间的相似度。此外,在单视角数据集上训练时,我们的方法应用了神经辐射场的思想来隐式渲染来自新视角的特征。与最近的行动识别方法相比,我们提出的方法在三个大规模数据集(Jester,Something-Something V2和Kinetics-400)上取得了最先进的结果。