Nov, 2023

AdaFocus:面向长视频动作理解的端到端弱监督学习

TL;DR开发用于长视频动作理解任务的端到端模型存在显著的计算和内存挑战。为了避免精确注释的需要,我们提出了一种弱监督方法 AdaFocus,它通过估计动作的高峰度和时间位置,从而能够自适应地聚焦于有助于更好训练的动作片段。在三个长视频数据集上的实验证明了其有效性,并且 AdaFocus 与弱监督特征提取流水线结合,显著提高了三个长视频动作理解任务。