ECCVNov, 2022

当坚强的骨架遇见强大的特征 —— 用于 Ego4D 时刻查询挑战的 ActionFormer

TL;DR我们在 Ego4D Moment Queries Challenge 2022 的比赛中使用了 ActionFormer 作为主体,加上 SlowFast、Omnivore 和 EgoVLP 三种强大的视频特征,我们的解决方案在测试集上的平均 mAP 为 21.76%,是官方基线的三倍,同时我们在 tIoU = 0.5 下获得 42.54%的 Recall @1x, 绝对百分比达 1.41 个百分点的显着优势。