May, 2024

多尺度瓶颈变形器用于弱监督的多模态暴力检测

TL;DR通过利用多种多样性的模态,如 RGB,光流和音频,以及仅具备视频级别注释的多模态暴力检测模型的学习,我们提出了一种新的弱监督多模态暴力检测方法,明确解决了信息冗余,模态不平衡和模态异步性等三个关键挑战,进一步提出了一种时间一致性对比损失来语义对齐成对融合特征。在最大规模的 XD-Violence 数据集上的实验表明,提出的方法实现了最先进的性能。