May, 2024

音视融合技术增强儿童视频多模态内容审核

TL;DR针对面向儿童的视频内容创作数量的增加,需要强大的视频托管平台内容审核方案。我们提出了一种有效的 CLIP 适应方法,利用上下文音频提示来增强内容审核,通过冻结各个模态的背景模块,将音频模态和提示学习融合,对多模态版本的恶意或良性数据集进行了实验。