逆向工程讽刺,或 “计算幽默论文” 尽管取得重大进展仍被接受
本研究提出了一个基于机器学习的新型幽默挖掘方法,通过结合心理学、语言学与自然语言处理的最新进展,利用一万余篇滑稽论文构建数据集,成功实现自动检测幽默科学论文的任务,并有望在科学研究中发挥重要作用。
Jun, 2021
理解各种幽默风格对于理解幽默的多面性以及其对心理学和人工智能等领域的影响至关重要。通过系统文献综述,我们调查了应用于二元幽默和讽刺识别等相关任务的计算技术的现状,揭示了它们与幽默风格分析的基本相关性,并确定了潜在的研究空白和有前景的方向。
Jan, 2024
通过编辑文本,我们研究了大型语言模型(LLMs)是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试,并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中,能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集,发现 GPT-4 的合成数据得到了双语注释者的高评价,并为幽默分类器提供了具有挑战性的对抗性例子。
Feb, 2024
本文介绍了一种新的用于讽刺检测的模型,该模型包括对抗性部分以控制发布源的混杂变量,最终得到了可观的讽刺分类性能和显著下降的发布分类性能。通过分析得出,对抗性组件是该模型关注讽刺语言属性的关键。
Feb, 2019
本文提出新的任务:判断一个笑话是否幽默,通过建立基于 Reddit 站点上近 16,000 标记实例的幽默评分模型,使用 Transformer 体系结构实现语句上下文的学习,取得了与人类表现可比较的成果,并在短笑话和双关语数据集上取得了 93.1% 和 98.6% 的 F-measure,这一方法超过了以前用于这些任务的所有先前工作。
Aug, 2019
本文研究自动分类假新闻和幽默新闻,结合语义表示、最新的语言模型和基于文本连贯性的语言特征,通过实证评估表明该方法优于基于语言的基线,并探讨假新闻和幽默新闻之间的差异。
Oct, 2019
本文讲述了 SemEval-2020 共享任务 “评估编辑新闻标题中的幽默”。任务的数据集包含应用了简短编辑使其有趣的新闻标题,这些编辑后的标题的有趣程度使用众包评级。该任务包括两个子任务,第一个是在 0-3 区间的幽默等级上估计标题的幽默程度。第二个子任务是为同一原始标题的一对编辑版本预测哪个更有趣。迄今为止,这是最受欢迎的共享计算幽默任务,吸引了 48 个团队参加第一个子任务和 31 个团队参加第二个子任务。
Aug, 2020
本文研究了关于讽刺新闻的多模态方法,并使用基于 ViLBERT 模型的新数据集对其进行评估,结果表明我们提出的多模态方法优于仅使用图像或文本或简单融合的方法。
Oct, 2020