- EMNLP通识知识是否有助于检测讽刺?
本研究探讨将常识知识融入到基于图卷积网络和预训练语言模型嵌入的模型中,用于识别口气讽刺的有效性,并在三个数据集上进行了实验,表明该方法不如基线模型表现优秀。
- 混合语言对话中的多模态讽刺检测和幽默分类
本研究开发了一个多模态的印地语 - 英语混合数据集用于会话中的多模态讽刺检测和幽默分类,并提出了一种新的基于注意力机制的神经架构 MSH-COMICS,该模型在两个任务中都具有优越性能。
- ACL潜在优化对抗神经转移用于讽刺检测
本文介绍了一种使用广义潜在优化策略的转移学习方法,用于解决源和目标域的特征分布相似性以及域特定性能之间的优化困难和减弱转移的问题,并在 iSarcasm 数据集上取得了 10.02% 的绝对性能提高。
- ACL结合无上下文信息和上下文信息表示进行阿拉伯语挖苦检测和情感识别
本研究提出了一种基于 AraBERT 语言模型与在阿拉伯社交媒体文献库上训练的静态词向量结合的混合模型,应用于阿拉伯推文的讽刺性和情感极性检测任务,实现了优异的 F1 - 讽刺得分和 F-PN 情感得分,并在两项任务中均优于多个现有的方法。
- ACL嘲讽在塑造不同意空间中的作用:是嘲笑你还是陪你笑?
研究表明,利用深度学习体系结构的联合建模来探测在线交互中引用讽刺的含义,改善了分类配置(同意 / 不同意 / 无)的论证关系任务。
- EMNLP反应式监督:一种收集讽刺数据的新方法
介绍了一种新的数据收集方法 —— 反应监督方法,利用在线对话的动态规律克服了现有数据收集技术的局限性,从而创建和发布了第一个具有讽刺视角标签和新的上下文特征的大规模推文数据集,预期将推动讽刺检测研究进展。该方法可应用于其他情感计算领域,从而 - 使用未标记的对话上下文增强数据以进行讽刺检测
该研究提出了一种新的数据增强技术 CRA(Contextual Response Augmentation),使用会话上下文生成有意义的样本来训练机器学习模型,该模型以提出的数据增强技术进行训练,并在 sarcasm detection 任 - ACL利用上下文分隔符在在线话语中检测讽刺
本文使用 RoBERTa_large 对 Twitter 和 Reddit 数据集进行讽刺检测,并通过使用三种不同类型的输入来确定上下文在提高性能方面的重要性。我们表明,我们提出的架构在两个数据集中都具有竞争力,并且在 Reddit 数据集 - ACL基于 Transformer 的社交媒体对话线程中上下文感知的讽刺检测
我们提出了一个基于 Transformer 模型的讽刺检测模型,可以有效考虑上下文,达到更加准确的预测,其在 Twitter 和 Reddit 的数据集上表现出了 3.1% 和 7.0% 的提升,F1 分别达到了 79.0% 和 75.0% - ACL代码切换模式可以是改善下游 NLP 应用程序性能的有效途径:以幽默、讽刺和仇恨言论检测为例的案例研究
本文阐述了如何利用代码转换模式来提高各种下游 NLP 应用的效果,特别是我们将不同的语言转换特征加入到幽默、讽刺和仇恨言论检测任务中。我们认为,这个简单的语言观察方法也可以在其他类似的 NLP 应用中有潜在的帮助。
- iSarcasm: 旨在表达讽刺的数据集
本文研究了文本挖掘中的讽刺检测,特别关注作者意图和读者解读的区别,介绍了作者直接标注的 iSarcasm 数据集,并指出现有方法在捕捉作者意图上的局限性,提出未来自然语言处理研究需要发展更优秀的检测方法。
- 使用混合神经网络进行讽刺语言检测
通过引入新的由新闻头条数据集组成的数据集,以及使用子神经网络和注意机制,本论文提出了一种有效识别铁 y 定义类的方法,其在分类精度方面优于基准线约 5%。
- ACL多模态讽刺检测(一篇_显然_完美的论文)
本文提出了一个基于多模态线索的新的讽刺数据集 (MUStARD),并且证明了将多模态信息应用于讽刺检测可以将相对误差率降低高达 12.9%。
- 使用多任务学习进行情感和讽刺分类
本论文旨在探讨情感分类和讽刺检测两个 NLP 任务之间的相关性,并提出了一种基于多任务学习的深度神经网络框架来模拟这种相关性,以改善这两个任务的性能。在基准数据集中,我们的方法比现有技术的表现提高了 3-4%。
- 基于对话背景的讽刺分析
研究了在社交媒体中检测讽刺语境下的对话背景、LSTM 网络、不同平台之间差异对结果的影响以及定位句子语气的研究,通过定量分析和注意力机制判别出实验结果优于人工标注。
- 英印混合代码推文语料库用于讽刺检测
通过英 - 印混合码数据集,我们开发了一个基于随机森林分类器并进行了 10 折交叉验证的基线监督分类系统,该系统可以检测到社交媒体上的文字中的反讽,并标记每个标记的语言标签。该系统平均得分为 78.4%。
- 网络互动中对话背景在讽刺检测中的作用
该研究通过研究社交媒体讨论发现,长短时记忆神经网络(LSTM)的不同类型能够更好地模拟讨论的背景并更好地识别出含有讽刺意味的回复,进一步使用定性分析方法研究 LSTM 模型的注意力加权效果。
- ACL利用句子补全技术进行讽刺检测:应对意外情况
该论文探讨了如何使用 Context2Vec 获取句子中不一致的词,进而提出了两种实现讽刺检测的方法,分别针对所有内容词以及最不一致的 50% 内容词,这些方法在推特上表现优异但并不适合于论坛帖子,讨论了导致这种情况发生的原因,并通过手动标 - 用于讽刺的大型自注释语料库
该论文介绍了自注释 Reddit 语料库(SARC),该语料库为讽刺研究以及训练和评估讽刺检测系统提供了大量的数据。每个陈述还被作者自行注释,并配有用户、主题和对话上下文。通过构建基准测试和评估基线方法,我们对该语料库进行了准确度评估。
- ACL利用认知特征进行讽刺检测
介绍了一种从阅读者的眼动模式中提取认知特征,用于增强特征向量,以提高讽刺检测的性能的新机制。使用增强的特征集进行统计分类,性能提高了 3.7%(以 F-score 为度量),超过了最佳报告系统的性能。