自动识别古怪的科学成就：这怎么获得了资金？！

ACLJun, 2021

自动识别古怪的科学成就：这怎么获得了资金？！

How Did This Get Funded?! Automatically Identifying Quirky Scientific Achievements

Chen Shani, Nadav Borenstein, Dafna Shahaf

TL;DR本研究提出了一个基于机器学习的新型幽默挖掘方法，通过结合心理学、语言学与自然语言处理的最新进展，利用一万余篇滑稽论文构建数据集，成功实现自动检测幽默科学论文的任务，并有望在科学研究中发挥重要作用。

Abstract

humor is an important social phenomenon, serving complex social and psychological functions. However, despite being studied for millennia humor is computationally not well understood, often considered an

humor ai humor mining nlp scientific papers

发现论文，激发创造

逆向工程讽刺，或 “计算幽默论文” 尽管取得重大进展仍被接受

本文深入探讨了讽刺新闻标题的语法和语义结构，找到了制造幽默的关键词和概念，为构建制造幽默的系统提供了新的见解。

Jan, 2019

幽默检测：一个变形金刚笑到最后

本文提出新的任务：判断一个笑话是否幽默，通过建立基于 Reddit 站点上近 16,000 标记实例的幽默评分模型，使用 Transformer 体系结构实现语句上下文的学习，取得了与人类表现可比较的成果，并在短笑话和双关语数据集上取得了 93.1% 和 98.6% 的 F-measure，这一方法超过了以前用于这些任务的所有先前工作。

Aug, 2019

笑脸头：Transformer 能否识别句子中的幽默元素？

通过对自动检测幽默的研究，我们训练了基于转换器的模型，并分析了幽默识别模型，进一步提高了模型性能和训练方法。

May, 2021

认真对待幽默：使用无趣的大型语言模型构建幽默数据集

通过编辑文本，我们研究了大型语言模型（LLMs）是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试，并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中，能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集，发现 GPT-4 的合成数据得到了双语注释者的高评价，并为幽默分类器提供了具有挑战性的对抗性例子。

Feb, 2024

我们是幽默的存在：理解和预测视觉幽默

本研究探讨了抽象场景中触发笑点的内容和不同类型的视觉幽默，设计了计算模型，完成了两种任务：预测场景的趣味性和改变场景的趣味性，通过公开数据集和人类研究展示了模型在定量和定性上的表现良好。

Dec, 2015

Cards Against AI: 预测填空式聚会游戏中的幽默

本文探讨了 Cards Against Humanity 这一聚会游戏中的幽默，并在分析了包括 785K 个独特笑话在内的 30 万场游戏数据集的基础上，使用机器学习模型预测了获胜笑话，发现短小、粗俗、幼稚的笑话更容易获胜。

Oct, 2022

自发幽默的多模态预测：一个新颖的数据集和初步结果

本文介绍了一种新的 Passau-SFCH 数据集，用于幽默和其情感和方向的自动分析，研究结果表明，对于幽默和其情感的自动分析，面部表情最有潜力，而文本特征最适合模拟幽默方向。

Sep, 2022

评估单口喜剧中的幽默系数：“你认为你很搞笑？

本文创建了一个通过标注观众的笑声来注释训练数据的幽默系数得分的新型评分机制的多模态幽默注释数据集，用于训练一个给予音频及相应文本一个五分量表中的 “有趣程度” 分数的模型，并比较了各种神经语言模型的幽默评分任务，其 QWK 准确度达到了 0.813。

Oct, 2021

使用 Transformer 全流程生成从科学摘要中获取幽默的标题

研究了基于 Transformer 的 7 种模型在 NLP 和机器学习场景下的抽象到标题生成问题，并扩展到更难的生成幽默科学论文标题的问题。使用人类和自动度量衡方法评估了所有模型，发现最好的端到端系统与人类作者表现相似，而 ChatGPT 的表现不错。

Dec, 2022

AI 有趣吗？HumorDB：一个经过精选的数据集和基准，用于研究图形幽默

通过 HumorDB 数据集，该研究论文介绍了一种用于提升视觉幽默理解能力的图像数据集，着重于触发幽默的微妙视觉线索，并缓解潜在的偏差。该数据集可以通过二元分类（有趣或无趣）、范围回归（将幽默性评分从 1 到 10 进行量化）和成对比较任务（哪个图像更有趣？）进行评估，有效捕捉了幽默感知的主观性。初步实验表明，虽然纯视觉模型面临困难，但视觉语言模型，特别是利用大型语言模型的模型，表现出有希望的结果。HumorDB 还展示了作为功能强大的大型多模态模型的一个有价值的零样本基准的潜力。我们在 CC BY 4.0 许可证下开源了数据集和代码。

Jun, 2024