我们是幽默的存在:理解和预测视觉幽默
通过 HumorDB 数据集,该研究论文介绍了一种用于提升视觉幽默理解能力的图像数据集,着重于触发幽默的微妙视觉线索,并缓解潜在的偏差。该数据集可以通过二元分类(有趣或无趣)、范围回归(将幽默性评分从 1 到 10 进行量化)和成对比较任务(哪个图像更有趣?)进行评估,有效捕捉了幽默感知的主观性。初步实验表明,虽然纯视觉模型面临困难,但视觉语言模型,特别是利用大型语言模型的模型,表现出有希望的结果。HumorDB 还展示了作为功能强大的大型多模态模型的一个有价值的零样本基准的潜力。我们在 CC BY 4.0 许可证下开源了数据集和代码。
Jun, 2024
本研究提出了一个基于机器学习的新型幽默挖掘方法,通过结合心理学、语言学与自然语言处理的最新进展,利用一万余篇滑稽论文构建数据集,成功实现自动检测幽默科学论文的任务,并有望在科学研究中发挥重要作用。
Jun, 2021
通过对具有矛盾叙事的漫画展开研究,本文引入了 YesBut 评估基准,旨在评估人工智能在识别和解释具有幽默矛盾的漫画方面的能力。通过广泛的实验和分析,我们发现即使是最先进的模型在此任务上仍然落后于人类表现,为人工智能在理解人类创造性表达方面的当前限制和潜在改进提供了见解。
May, 2024
本研究提出了 OxfordTVG-HIC(Humorous Image Captions),这是用于幽默生成和理解的大规模数据集。通过对所训练模型进行解释性分析,我们发现视觉和语言线索对于引起幽默预测(和生成)具有影响力,并定性地观察到这些线索与认知心理学中的害笑违例理论相一致。
Jul, 2023
本文介绍了一种新的 Passau-SFCH 数据集,用于幽默和其情感和方向的自动分析,研究结果表明,对于幽默和其情感的自动分析,面部表情最有潜力,而文本特征最适合模拟幽默方向。
Sep, 2022
本文介绍了一种称为 UR-FUNNY 的多模态数据集,该数据集开辟了解析表达幽默的多模态语言的研究领域,从而为自然语言处理社区提供了多模态幽默检测的框架。
Apr, 2019
本文介绍了一种基于计算机视觉的图像标注系统 -- Neural Joking Machine(NJM),该系统可根据主题(图像)和有趣的标题(文本)自动输出有趣的标题,并使用 Funny Score 对模型进行优化,实验结果表明,使用 NJM 的结果比使用基线(MS COCO Pre-trained CNN+LSTM)更为有效。
May, 2018