Mar, 2024

社交媒体数据的 N 模态对比损失及其在三模空间中的应用

TL;DR通过将对比损失函数扩展到任意数量的模态,本文在社交媒体中探讨三模态空间的实用性,并在两个 OSINT 情景中展示了三模态模型的使用价值:将社交媒体文物帖子分类为亲俄罗斯或亲乌克兰,以及识别给定文物的原始账户。此外,本文还展示了一种新型的四模态 CLIP 模型,可以学习文本、图像、视频和音频之间的相互作用。在四模态模型检索中,展示了新的最先进基准结果。