May, 2021

社交媒体新闻帖子中的多模态语义不一致检测

TL;DR本研究提出了一种用于识别社交媒体新闻帖子中视频外观和文本标题之间语义不一致的分类架构,通过使用基于文本分析、自动音频转录、语义视频分析、对象检测、命名实体一致性和面部验证的多模态融合框架来发现社交媒体帖子中的视频和标题之间的不匹配。通过训练和测试基于 4,000 个 Facebook 新闻帖子的新视频数据集,我们的多模态方法在随机标题和外观不匹配的情况下实现了 60.5%的分类准确性,而单模分别准确率不到 50%。进一步的消融研究证实了跨模态融合对于正确识别语义不一致性的必要性。