Jun, 2023

从语言角度重新审视基于弱监督的音视频分析

TL;DR本文提出通过语言描述每个视频段的事件出现情况并计算语言提示与段落的相似度来识别事件并调整不可靠段落标签的方法,优于现有同类方法。