基于极性的半图 Sarcasm 检测
本研究旨在对英语计算讽刺研究的最新进展和趋势进行简要概述,包括使用非监督预训练转换器在多模态环境中进行讽刺检测以及整合上下文以识别讽刺。我们介绍与讽刺相关的数据集、方法、趋势、问题、挑战和任务,提供针对讽刺的特征和其提取方法的汇总表,以及各种方法的性能分析,这些都可以帮助相关领域的研究人员了解讽刺检测中的最新技术实践。
Sep, 2022
分析社交媒体上多模态信息中,表面情感和隐含情感之间的关系,探究图像在人类注释中的必要性,并提出了两种不同的计算框架来检测其中的讽刺色彩。结果表明,结合多模态信息的检测方法在各平台上均取得了良好的效果。
Aug, 2016
本研究探讨了生成预训练转换器(GPT)模型(包括 GPT-3、InstructGPT、GPT-3.5 和 GPT-4)在检测自然语言中的讽刺的应用。该研究测试了不同大小和版本的精调和零 - shot 模型,并在 Self-Annotated Reddit Corpus(SARC 2.0)的政治和均衡(pol-bal)部分的讽刺数据集上进行了评估。结果显示,在精调的情况下,最大的精调 GPT-3 模型在准确性和 F1-score 方面达到了 0.81,超过了之前的模型。在零 - shot 的情况下,其中一个 GPT-4 模型的准确性为 0.70,F1-score 为 0.75,其他模型得分较低。此外,每个版本的模型性能可能会有所改善或恶化,强调了需要在每个版本发布后重新评估性能的必要性。
Dec, 2023
本文汇总了过去的研究成果,讨论了自动讽刺检测的数据集、方法、趋势和问题,并呈现了过去有关特征、注释技术和数据形式等不同方面的论文总结表格。关键技术包括半监督模式提取、基于标签的监督以及针对目标文本进行的上下文分析。
Feb, 2016
本文提出了一种基于层次结构的检测方法,通过多头交叉注意力机制和图神经网络同时探索文本和图像之间的原子级一致性和组成级一致性,利用丰富的外部知识资源进行讽刺检测,评估结果表明该模型优于现有的技术。
Oct, 2022
本文介绍了 UTNLP 团队在 SemEval-2022 共享任务 6 中进行讽刺性评论检测的方法和结果,对比了不同模型和数据增强方法的效果,最后使用 RoBERTa 和数据突变增强的方法取得了最佳结果。
Apr, 2022
本文介绍了应用基于深度学习的模型以及预训练的语言模型,在英语和阿拉伯语中进行讽刺检测任务。我们的系统已参与了所有子任务,并在阿拉伯语子任务 A 中取得最佳表现,在子任务 B 中排名第二,在子任务 C 中分别在阿拉伯语和英语数据集中排名第 7 和第 11。
Jun, 2022
研究发现,找出人们的反讽和言语讽刺对于理解他们的实际情感和信仰至关重要。因此,反讽分析已成为自然语言处理中一个热门的研究问题。本文作为 FigLang2020 会议的一部分,介绍了一个 sarcasm detection 共享任务,旨在进行基准研究,以分析最先进的技术,推动该领域的进展。
May, 2020
本文提出了讽刺解释的翻译任务,并介绍了一个包含 3000 个讽刺推文的数据集和一个基于机器翻译算法的讽刺解释算法:SIGN。该算法针对情感词等定义性元素,展示了让人比其他解释模型更高的充分性和情感极性分数。此外,本文还讨论了未来研究方向。
Apr, 2017