Dec, 2022

MAViC: 视频字幕的多模式主动学习

TL;DR本文介绍了 MAViC,它利用我们提出的基于多模态语义感知的序列熵 (M-SASE) 的获得函数来解决视频字幕主动学习方法的挑战。我们的方法在获取函数中集成了语义相似性和视觉和语言维度的不确定性。我们的实验表明,M-SASE 在视频字幕主动学习方面的功效之外,并通过大幅度优于基线。