¡ 太神奇了!西班牙语中的多模式讽刺检测:数据集和基线
本研究开发了一个多模态的印地语 - 英语混合数据集用于会话中的多模态讽刺检测和幽默分类,并提出了一种新的基于注意力机制的神经架构 MSH-COMICS,该模型在两个任务中都具有优越性能。
May, 2021
使用 MUStARD++ 数据集进行多模态严格基准测试,考虑最先进的语言、语音和视觉编码器,充分利用其多模态丰富性,实现超过现有基准的 2%宏平均 F1 值的改善;此外,提出了称为 MUStARD++ 平衡的扩展来解决 MUStARD++ 中 `sarcasm type` 类别的不平衡问题,通过将扩展中的实例分布于训练和测试集,进一步提升 2.4%的宏平均 F1 值。新的片段来自于电视节目 House MD,丰富了数据集的多样性,并由多名注释者进行了手动注释,根据 Cohen's kappa 和 Krippendorf's alpha 的显著的注释者一致性进行了注释。我们的代码、扩展数据和 SOTA 基准模型已经公开。
Sep, 2023
本论文针对识别嘲讽表达中的情感这一未被探索的任务,使用了最近发布的多模态嘲讽检测数据集(MUStARD)进行研究,并修正了其中的错误标签,最终将数据集标记上情感、情感强度和具体嘲讽类型,并提出多模态融合模型,用于嘲讽情感识别,表现优于现有的技术水平。
Jun, 2022
分析社交媒体上多模态信息中,表面情感和隐含情感之间的关系,探究图像在人类注释中的必要性,并提出了两种不同的计算框架来检测其中的讽刺色彩。结果表明,结合多模态信息的检测方法在各平台上均取得了良好的效果。
Aug, 2016
介绍了 MMSD2.0 数据集用于多模态讽刺检测问题,引入了利用多视角(文本、图像、文本图像交互视角)的多粒度线索的新框架 multi-view CLIP,实验证明 MMSD2.0 是构建可靠的多模态讽刺检测系统的有价值的基准,可以显著优于以前的最佳基准线。
Jul, 2023
本研究提出了一个用于文档级多模式讽刺理解的全面基准测试,并引入了细粒度的讽刺理解方法,有效地将图像特征与文本特征在文档中进行对齐,实验证明该方法可以作为具有挑战性的 DocMSU 的基线方法。
Dec, 2023
本文提出了一种基于层次结构的检测方法,通过多头交叉注意力机制和图神经网络同时探索文本和图像之间的原子级一致性和组成级一致性,利用丰富的外部知识资源进行讽刺检测,评估结果表明该模型优于现有的技术。
Oct, 2022
该论文提出了一个新的问题:多模态讽刺解释(MuSE),旨在针对一个带有图像和标题的多模态讽刺贴文,生成自然语言解释以揭示意图的讽刺。通过使用一个跨模态注意力的 Transformer 编码器,并使用 BART 的自回归解码器作为生成器,该论文提供了一个 Multimodal 讽刺解释数据集,并以各种基线进行了实证结果评估。
Dec, 2021
本文提出一种基于量子概率的多模态讽刺、情感和情绪分析框架(QUIET),通过在两个数据集上进行大量实验,证明了 QUIET 与现有技术相比的有效性和优越性,并展示了量子概率在多情感分析中的巨大潜力。
Jun, 2023