何时使用 “更多语境” 有助于辨别嘲讽?
本文使用 RoBERTa_large 对 Twitter 和 Reddit 数据集进行讽刺检测,并通过使用三种不同类型的输入来确定上下文在提高性能方面的重要性。我们表明,我们提出的架构在两个数据集中都具有竞争力,并且在 Reddit 数据集中增加分隔符可以提高 F1 分数的 5.13%。
Jun, 2020
本文提出一种模型,使用预训练的转换器和 CNN 捕捉上下文特征,用于捕捉蕴含在讽刺中的不一致性,并在社交网络平台和在线媒体的四个数据集上优于以前的最新成果。
Nov, 2022
该研究通过研究社交媒体讨论发现,长短时记忆神经网络(LSTM)的不同类型能够更好地模拟讨论的背景并更好地识别出含有讽刺意味的回复,进一步使用定性分析方法研究 LSTM 模型的注意力加权效果。
Jul, 2017
研究了在社交媒体中检测讽刺语境下的对话背景、LSTM 网络、不同平台之间差异对结果的影响以及定位句子语气的研究,通过定量分析和注意力机制判别出实验结果优于人工标注。
Aug, 2018
本文提出了一种基于层次结构的检测方法,通过多头交叉注意力机制和图神经网络同时探索文本和图像之间的原子级一致性和组成级一致性,利用丰富的外部知识资源进行讽刺检测,评估结果表明该模型优于现有的技术。
Oct, 2022
该研究提出了一个基于深度神经网络的、用于自动检测讽刺的模型,其中利用了用户嵌入向量和词汇信号,避免繁琐的特征工程和数据爬取,经实验证明总体效果优于现有方法。
Jul, 2016
本研究探讨将常识知识融入到基于图卷积网络和预训练语言模型嵌入的模型中,用于识别口气讽刺的有效性,并在三个数据集上进行了实验,表明该方法不如基线模型表现优秀。
Sep, 2021
本研究提出了 CASCADE (a ContextuAl SarCasm DEtector) 用于在在线社交媒体讨论中,采用基于内容和上下文驱动的混合方法进行讽刺检测,能够提取讨论线程中的上下文信息,使用用户嵌入来编码用户的风格和个性特征,与卷积神经网络(CNN)等基于内容的特征提取器一起使用时,可显著提高 Reddit 语料库的分类性能。
May, 2018
本文介绍一种基于概率建模的新颖方法,通过使用人类讽刺基准对神经网络进行训练,识别、分类和学习讽刺文本的特征,并建立一个对细微差异敏感的情感分析模式,以实现更自然、更吸引人的对话系统。
Nov, 2017