BriefGPT.xyz
Ask
alpha
关键词
audio-visual input
搜索结果 - 1
ECCV
不仅仅看,还要听:弱监督下学习多模态暴力检测
本文提出了一种基于多模态的神经网络的暴力检测方法,通过发布了一个大规模多场景的数据集 XD-Violence,证明了该方法在判断暴力视频方面的优越性,并通过实验证明了多模态(包括视听)输入和建模关系的积极影响。
PDF
4 years ago
Prev
Next