基于 OpenAI GPT 模型的讽刺检测研究

Dec, 2023

基于 OpenAI GPT 模型的讽刺检测研究

On Sarcasm Detection with OpenAI GPT-based Models

Montgomery Gole, Williams-Paul Nwadiugwu, Andriy Miranskyy

TL;DR本研究探讨了生成预训练转换器（GPT）模型（包括 GPT-3、InstructGPT、GPT-3.5 和 GPT-4）在检测自然语言中的讽刺的应用。该研究测试了不同大小和版本的精调和零 - shot 模型，并在 Self-Annotated Reddit Corpus（SARC 2.0）的政治和均衡（pol-bal）部分的讽刺数据集上进行了评估。结果显示，在精调的情况下，最大的精调 GPT-3 模型在准确性和 F1-score 方面达到了 0.81，超过了之前的模型。在零 - shot 的情况下，其中一个 GPT-4 模型的准确性为 0.70，F1-score 为 0.75，其他模型得分较低。此外，每个版本的模型性能可能会有所改善或恶化，强调了需要在每个版本发布后重新评估性能的必要性。

Abstract

sarcasm is a form of irony that requires readers or listeners to interpret its intended meaning by considering context and social cues. Machine learning classification models have long had difficulty detecting

sarcasm irony machine learning classification generative pretrained transformer models gpt-3

发现论文，激发创造

对最先进的大型语言模型在讽刺检测方面的评估

使用先进的语言表示模型和上下文驱动模型，对 Reddit 语料库进行分析，评估其性能并找到理想的讽刺检测方法。

Oct, 2023

UTNLP 参加 SemEval-2022 任务 6：基于生成式和变异式数据增强的讽刺检测比较分析

本文介绍了 UTNLP 团队在 SemEval-2022 共享任务 6 中进行讽刺性评论检测的方法和结果，对比了不同模型和数据增强方法的效果，最后使用 RoBERTa 和数据突变增强的方法取得了最佳结果。

Apr, 2022

SemEval-2022 任务 6：面向英语和阿拉伯语的基于 Transformer 的言外之意侦测模型 CS-UM6P

本文介绍了应用基于深度学习的模型以及预训练的语言模型，在英语和阿拉伯语中进行讽刺检测任务。我们的系统已参与了所有子任务，并在阿拉伯语子任务 A 中取得最佳表现，在子任务 B 中排名第二，在子任务 C 中分别在阿拉伯语和英语数据集中排名第 7 和第 11。

Jun, 2022

基于上下文、情感和情感特征的讽刺检测框架

本文提出一种模型，使用预训练的转换器和 CNN 捕捉上下文特征，用于捕捉蕴含在讽刺中的不一致性，并在社交网络平台和在线媒体的四个数据集上优于以前的最新成果。

Nov, 2022

利用上下文分隔符在在线话语中检测讽刺

本文使用 RoBERTa_large 对 Twitter 和 Reddit 数据集进行讽刺检测，并通过使用三种不同类型的输入来确定上下文在提高性能方面的重要性。我们表明，我们提出的架构在两个数据集中都具有竞争力，并且在 Reddit 数据集中增加分隔符可以提高 F1 分数的 5.13％。

Jun, 2020

一种通用的讽刺检测方法即将到来，当然！

对四个具有不同讽刺特征的讽刺数据集进行精调的讽刺检测模型的鲁棒性进行了测试，结果发现使用第三方标签进行精调的模型在内部数据集预测中表现更好，而大多数模型在跨数据集预测中无法很好地进行泛化，暗示一个数据集类型无法代表不同风格和领域的所有种类的讽刺。与现有数据集相比，本研究发布的新数据集上精调的模型在与其他数据集的泛化性能上表现最好。通过手动检查数据集和事后分析，我们发现泛化困难的原因在于讽刺实际上存在不同的领域和风格。我们认为未来的讽刺研究应考虑讽刺的广泛范围。

Apr, 2024

基于极性的半图 Sarcasm 检测

本文介绍了一种新颖的语义图 (semigraph) 方法，通过计算极性分数 (polarity scores) 实现对讽刺语气的检测，在亚马逊产品评论数据上的表现达到了准确度 0.87、召回率 0.79 和 F1 值 0.83。

Apr, 2023

社交媒体上的计算机挖掘讽刺语言：系统综述

本研究旨在对英语计算讽刺研究的最新进展和趋势进行简要概述，包括使用非监督预训练转换器在多模态环境中进行讽刺检测以及整合上下文以识别讽刺。我们介绍与讽刺相关的数据集、方法、趋势、问题、挑战和任务，提供针对讽刺的特征和其提取方法的汇总表，以及各种方法的性能分析，这些都可以帮助相关领域的研究人员了解讽刺检测中的最新技术实践。

Sep, 2022

使用 BERT 和 GloVe 嵌入技术检测推文中的讽刺

本文提出使用 BERT 和 GloVe 嵌入的机器学习技术来检测推文中的讽刺，该模型利用用户的响应上下文和实际响应来增强检测结果。

Jun, 2020

社交媒体文本中讽刺检测的研究视角

在社交媒体上大量使用讽刺文本会对目标用户产生生理影响，讽刺检测对于用户来说很困难，更对于机器来说是具有挑战性的。此论文讨论了各种讽刺检测技术及其相关数据集等，并总结了一些方法、挑战和未来的方向。

Apr, 2023