笑脸头：Transformer 能否识别句子中的幽默元素？

IJCAIMay, 2021

笑脸头：Transformer 能否识别句子中的幽默元素？

Laughing Heads: Can Transformers Detect What Makes a Sentence Funny?

Maxime Peyrard, Beatriz Borges, Kristina Gligorić, Robert West

TL;DR通过对自动检测幽默的研究，我们训练了基于转换器的模型，并分析了幽默识别模型，进一步提高了模型性能和训练方法。

Abstract

The automatic detection of humor poses a grand challenge for natural language processing. Transformer-based systems have recently achieved remarkable results on this task, but they usually (1)~were evaluated in setups where serious vs humorous texts came from entirely different sources

automatic detection humor recognition transformer-based models dataset attention weights

发现论文，激发创造

幽默检测：一个变形金刚笑到最后

本文提出新的任务：判断一个笑话是否幽默，通过建立基于 Reddit 站点上近 16,000 标记实例的幽默评分模型，使用 Transformer 体系结构实现语句上下文的学习，取得了与人类表现可比较的成果，并在短笑话和双关语数据集上取得了 93.1% 和 98.6% 的 F-measure，这一方法超过了以前用于这些任务的所有先前工作。

Aug, 2019

使用 Transformer 全流程生成从科学摘要中获取幽默的标题

研究了基于 Transformer 的 7 种模型在 NLP 和机器学习场景下的抽象到标题生成问题，并扩展到更难的生成幽默科学论文标题的问题。使用人类和自动度量衡方法评估了所有模型，发现最好的端到端系统与人类作者表现相似，而 ChatGPT 的表现不错。

Dec, 2022

顽皮变压器：理解冒犯幽默

本研究通过引入一个由 Reddit 过滤的新颖笑话数据集，并使用经过微调的 Transformer（Naughtyformer）解决了幽默子类型分类任务，特别是恶意笑话；同时表明我们的模型在检测冒犯性笑话方面比现有方法显著更好。

Nov, 2022

认真对待幽默：使用无趣的大型语言模型构建幽默数据集

通过编辑文本，我们研究了大型语言模型（LLMs）是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试，并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中，能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集，发现 GPT-4 的合成数据得到了双语注释者的高评价，并为幽默分类器提供了具有挑战性的对抗性例子。

Feb, 2024

逆向工程讽刺，或 “计算幽默论文” 尽管取得重大进展仍被接受

本文深入探讨了讽刺新闻标题的语法和语义结构，找到了制造幽默的关键词和概念，为构建制造幽默的系统提供了新的见解。

Jan, 2019

自动识别古怪的科学成就：这怎么获得了资金？！

本研究提出了一个基于机器学习的新型幽默挖掘方法，通过结合心理学、语言学与自然语言处理的最新进展，利用一万余篇滑稽论文构建数据集，成功实现自动检测幽默科学论文的任务，并有望在科学研究中发挥重要作用。

Jun, 2021

使用 Transformer 进行可解释的口语欺骗检测

本文提出并评估了六种深度学习模型，包括 BERT（和 RoBERTa），MultiHead Attention，co-attentions 和 transformers，结果表明我们的基于 transformer 的模型可以提高自动化的欺骗检测性能（+2.11％的准确率），并显示与真实和欺骗陈述中 LIWC 特征使用相关的显着差异。

Oct, 2022

解读并列: AI 模型能理解幽默的矛盾吗

通过对具有矛盾叙事的漫画展开研究，本文引入了 YesBut 评估基准，旨在评估人工智能在识别和解释具有幽默矛盾的漫画方面的能力。通过广泛的实验和分析，我们发现即使是最先进的模型在此任务上仍然落后于人类表现，为人工智能在理解人类创造性表达方面的当前限制和潜在改进提供了见解。

May, 2024

Plumeria 参加 SemEval-2022 任务 6：使用变形金刚和数据增强的鲁棒性挖掘英文和阿拉伯文的讽刺语言

本文介绍了我们对 SemEval-2022 任务 6：针对英语和阿拉伯语的讽刺检测及其五个子任务的参赛作品。我们使用基于 transformers 的深度学习技术来检测讽刺，数据集来自推特，数据预处理对于任务至关重要，我们的排名在四个子任务中保持稳定，这说明我们使用的模型和技术具有鲁棒性和稳定性。

Mar, 2022

自发幽默的多模态预测：一个新颖的数据集和初步结果

本文介绍了一种新的 Passau-SFCH 数据集，用于幽默和其情感和方向的自动分析，研究结果表明，对于幽默和其情感的自动分析，面部表情最有潜力，而文本特征最适合模拟幽默方向。

Sep, 2022