CVPRMay, 2022

由音频叙述引导的弱监督行为检测

TL;DR提出了一种基于多模态学习和叙述监督的视频检测模型,可以从嘈杂的音频叙述中学习动作检测,从而降低标注的费用。