ACLFeb, 2024

对齐先于关注:为多模态仇恨内容检测对齐视觉和文字特征

TL;DR提出了一种上下文感知的注意力框架用于多模态仇恨内容检测,对英语和非英语语言进行了评估,并通过对 MUTE 和 MultiOFF 数据集的 F1 分数进行评估,证明了该方法的有效性。