CVPRDec, 2018

长视频中基于排名感知的时间注意力技能判定的优缺点

TL;DR通过可学习的时间注意力模块,我们提出了一个新的模型来确定长视频的相对技能。我们的方法训练了两个注意力模块,分别关注指示更高(pros)和更低(cons)技能的视频部分,并使用新颖的排名感知损失函数。该方法在 EPIC-Skills 数据集上表现优异,比以前的方法和经典的 softmax 注意力提高了 4%的成对准确性,并且在个别任务上提高了高达 12%。