一种通用的讽刺检测方法即将到来，当然！

Apr, 2024

一种通用的讽刺检测方法即将到来，当然！

Generalizable Sarcasm Detection Is Just Around The Corner, Of Course!

Hyewon Jang, Diego Frassinelli

TL;DR对四个具有不同讽刺特征的讽刺数据集进行精调的讽刺检测模型的鲁棒性进行了测试，结果发现使用第三方标签进行精调的模型在内部数据集预测中表现更好，而大多数模型在跨数据集预测中无法很好地进行泛化，暗示一个数据集类型无法代表不同风格和领域的所有种类的讽刺。与现有数据集相比，本研究发布的新数据集上精调的模型在与其他数据集的泛化性能上表现最好。通过手动检查数据集和事后分析，我们发现泛化困难的原因在于讽刺实际上存在不同的领域和风格。我们认为未来的讽刺研究应考虑讽刺的广泛范围。

Abstract

We tested the robustness of sarcasm detection models by examining their behavior when fine-tuned on four sarcasm datasets containing varying characteristics of sarcasm: label source (authors vs. third-party), dom

sarcasm detection models fine-tuned intra-dataset predictions cross-dataset predictions generalizability

发现论文，激发创造

社交媒体文本中讽刺检测的研究视角

在社交媒体上大量使用讽刺文本会对目标用户产生生理影响，讽刺检测对于用户来说很困难，更对于机器来说是具有挑战性的。此论文讨论了各种讽刺检测技术及其相关数据集等，并总结了一些方法、挑战和未来的方向。

Apr, 2023

iSarcasm: 旨在表达讽刺的数据集

本文研究了文本挖掘中的讽刺检测，特别关注作者意图和读者解读的区别，介绍了作者直接标注的 iSarcasm 数据集，并指出现有方法在捕捉作者意图上的局限性，提出未来自然语言处理研究需要发展更优秀的检测方法。

Nov, 2019

基于 OpenAI GPT 模型的讽刺检测研究

本研究探讨了生成预训练转换器（GPT）模型（包括 GPT-3、InstructGPT、GPT-3.5 和 GPT-4）在检测自然语言中的讽刺的应用。该研究测试了不同大小和版本的精调和零 - shot 模型，并在 Self-Annotated Reddit Corpus（SARC 2.0）的政治和均衡（pol-bal）部分的讽刺数据集上进行了评估。结果显示，在精调的情况下，最大的精调 GPT-3 模型在准确性和 F1-score 方面达到了 0.81，超过了之前的模型。在零 - shot 的情况下，其中一个 GPT-4 模型的准确性为 0.70，F1-score 为 0.75，其他模型得分较低。此外，每个版本的模型性能可能会有所改善或恶化，强调了需要在每个版本发布后重新评估性能的必要性。

Dec, 2023

对最先进的大型语言模型在讽刺检测方面的评估

使用先进的语言表示模型和上下文驱动模型，对 Reddit 语料库进行分析，评估其性能并找到理想的讽刺检测方法。

Oct, 2023

使用深度卷积神经网络深入研究讽刺推特

通过基于预训练的卷积神经网络提取情感，情绪和人格特征以及网络的基本特征，我们开发的模型可以有效区分讽刺语句并解决分类新数据的普适性问题。

Oct, 2016

自动讽刺识别：一项调查

本文汇总了过去的研究成果，讨论了自动讽刺检测的数据集、方法、趋势和问题，并呈现了过去有关特征、注释技术和数据形式等不同方面的论文总结表格。关键技术包括半监督模式提取、基于标签的监督以及针对目标文本进行的上下文分析。

Feb, 2016

多模态讽刺检测（一篇_显然_完美的论文）

本文提出了一个基于多模态线索的新的讽刺数据集 (MUStARD)，并且证明了将多模态信息应用于讽刺检测可以将相对误差率降低高达 12.9%。