Cards Against AI: 预测填空式聚会游戏中的幽默
本研究提出了一个基于机器学习的新型幽默挖掘方法,通过结合心理学、语言学与自然语言处理的最新进展,利用一万余篇滑稽论文构建数据集,成功实现自动检测幽默科学论文的任务,并有望在科学研究中发挥重要作用。
Jun, 2021
通过 HumorDB 数据集,该研究论文介绍了一种用于提升视觉幽默理解能力的图像数据集,着重于触发幽默的微妙视觉线索,并缓解潜在的偏差。该数据集可以通过二元分类(有趣或无趣)、范围回归(将幽默性评分从 1 到 10 进行量化)和成对比较任务(哪个图像更有趣?)进行评估,有效捕捉了幽默感知的主观性。初步实验表明,虽然纯视觉模型面临困难,但视觉语言模型,特别是利用大型语言模型的模型,表现出有希望的结果。HumorDB 还展示了作为功能强大的大型多模态模型的一个有价值的零样本基准的潜力。我们在 CC BY 4.0 许可证下开源了数据集和代码。
Jun, 2024
我们提供了一个独特的多模态偏好数据集,用于创意任务,在过去的八年中通过众包整理了超过 250 万个标注为《纽约客》周刊漫画字幕比赛的超过 2.2 亿个人类评分。通过结合 GPT4 和人类判断,建立了基于排名的评估策略,我们对模型生成的字幕质量提出了新的评估标准。实验证明了当前的 Fine-Tuning 方法在创意任务中的局限性,并且我们展示了即使是 GPT4 和 Claude 这样的最先进模型在生成幽默字幕方面也不及顶级人类参赛者。经过这项大规模的数据收集工作,我们将整个偏好数据集释放给研究界,促进 AI 幽默生成和评估的进一步发展。
Jun, 2024
本研究实验比较了十二种自动方法来选择最有趣的标题,结果表明,负面情感、以人为本和词汇中心性最能匹配最有趣的标题,其次是正面情感。这些结果有助于理解幽默,并在文本和多模(视觉 + 文本)系统中设计更加引人入胜的对话代理人。
Jun, 2015
本文介绍了一种基于计算机视觉的图像标注系统 -- Neural Joking Machine(NJM),该系统可根据主题(图像)和有趣的标题(文本)自动输出有趣的标题,并使用 Funny Score 对模型进行优化,实验结果表明,使用 NJM 的结果比使用基线(MS COCO Pre-trained CNN+LSTM)更为有效。
May, 2018
本文探究了用于幽默识别的 transfer learning 方式 ——prompting 对于 NLP 系统的有效性,并通过应用 influence functions 观察了幽默与 offense 之间的关系。实验结果表明:在低资源的幽默识别任务中,prompting 具有出色的性能表现。
Oct, 2022
通过对具有矛盾叙事的漫画展开研究,本文引入了 YesBut 评估基准,旨在评估人工智能在识别和解释具有幽默矛盾的漫画方面的能力。通过广泛的实验和分析,我们发现即使是最先进的模型在此任务上仍然落后于人类表现,为人工智能在理解人类创造性表达方面的当前限制和潜在改进提供了见解。
May, 2024
本研究探讨了抽象场景中触发笑点的内容和不同类型的视觉幽默,设计了计算模型,完成了两种任务:预测场景的趣味性和改变场景的趣味性,通过公开数据集和人类研究展示了模型在定量和定性上的表现良好。
Dec, 2015
本文介绍了一种新的 Passau-SFCH 数据集,用于幽默和其情感和方向的自动分析,研究结果表明,对于幽默和其情感的自动分析,面部表情最有潜力,而文本特征最适合模拟幽默方向。
Sep, 2022
本文提出多种方法来通过个性化来提高语音控制虚拟助手的幽默水平,其中使用了传统的 NLP 技术和自注意网络和多任务学习相结合的方法,并探讨了隐式反馈的标记策略。实验结果表明,这些深度学习方法比其他方法具有更好的幽默表现,并且可以提高用户满意度。
Dec, 2019