自动识别古怪的科学成就:这怎么获得了资金?!
本文提出新的任务:判断一个笑话是否幽默,通过建立基于 Reddit 站点上近 16,000 标记实例的幽默评分模型,使用 Transformer 体系结构实现语句上下文的学习,取得了与人类表现可比较的成果,并在短笑话和双关语数据集上取得了 93.1% 和 98.6% 的 F-measure,这一方法超过了以前用于这些任务的所有先前工作。
Aug, 2019
通过编辑文本,我们研究了大型语言模型(LLMs)是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试,并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中,能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集,发现 GPT-4 的合成数据得到了双语注释者的高评价,并为幽默分类器提供了具有挑战性的对抗性例子。
Feb, 2024
本研究探讨了抽象场景中触发笑点的内容和不同类型的视觉幽默,设计了计算模型,完成了两种任务:预测场景的趣味性和改变场景的趣味性,通过公开数据集和人类研究展示了模型在定量和定性上的表现良好。
Dec, 2015
本文探讨了 Cards Against Humanity 这一聚会游戏中的幽默,并在分析了包括 785K 个独特笑话在内的 30 万场游戏数据集的基础上,使用机器学习模型预测了获胜笑话,发现短小、粗俗、幼稚的笑话更容易获胜。
Oct, 2022
本文介绍了一种新的 Passau-SFCH 数据集,用于幽默和其情感和方向的自动分析,研究结果表明,对于幽默和其情感的自动分析,面部表情最有潜力,而文本特征最适合模拟幽默方向。
Sep, 2022
本文创建了一个通过标注观众的笑声来注释训练数据的幽默系数得分的新型评分机制的多模态幽默注释数据集,用于训练一个给予音频及相应文本一个五分量表中的 “有趣程度” 分数的模型,并比较了各种神经语言模型的幽默评分任务,其 QWK 准确度达到了 0.813。
Oct, 2021
研究了基于 Transformer 的 7 种模型在 NLP 和机器学习场景下的抽象到标题生成问题,并扩展到更难的生成幽默科学论文标题的问题。使用人类和自动度量衡方法评估了所有模型,发现最好的端到端系统与人类作者表现相似,而 ChatGPT 的表现不错。
Dec, 2022
通过 HumorDB 数据集,该研究论文介绍了一种用于提升视觉幽默理解能力的图像数据集,着重于触发幽默的微妙视觉线索,并缓解潜在的偏差。该数据集可以通过二元分类(有趣或无趣)、范围回归(将幽默性评分从 1 到 10 进行量化)和成对比较任务(哪个图像更有趣?)进行评估,有效捕捉了幽默感知的主观性。初步实验表明,虽然纯视觉模型面临困难,但视觉语言模型,特别是利用大型语言模型的模型,表现出有希望的结果。HumorDB 还展示了作为功能强大的大型多模态模型的一个有价值的零样本基准的潜力。我们在 CC BY 4.0 许可证下开源了数据集和代码。
Jun, 2024