CVPRJun, 2023

物体如何帮助动作识别?

TL;DR本文提出了一种针对视频模型的对象引导的标记采样策略以及对象感知的注意力模块来改善识别精度,并使用较少的标记与强基线匹配,并在处理相同数量的标记时,在 SomethingElse、Something-something v2 和 Epic-Kitchens 数据集上分别提高 0.6 到 4.2 个点。