笑脸头:Transformer 能否识别句子中的幽默元素?
本文提出新的任务:判断一个笑话是否幽默,通过建立基于 Reddit 站点上近 16,000 标记实例的幽默评分模型,使用 Transformer 体系结构实现语句上下文的学习,取得了与人类表现可比较的成果,并在短笑话和双关语数据集上取得了 93.1% 和 98.6% 的 F-measure,这一方法超过了以前用于这些任务的所有先前工作。
Aug, 2019
研究了基于 Transformer 的 7 种模型在 NLP 和机器学习场景下的抽象到标题生成问题,并扩展到更难的生成幽默科学论文标题的问题。使用人类和自动度量衡方法评估了所有模型,发现最好的端到端系统与人类作者表现相似,而 ChatGPT 的表现不错。
Dec, 2022
本研究通过引入一个由 Reddit 过滤的新颖笑话数据集,并使用经过微调的 Transformer(Naughtyformer)解决了幽默子类型分类任务,特别是恶意笑话;同时表明我们的模型在检测冒犯性笑话方面比现有方法显著更好。
Nov, 2022
通过编辑文本,我们研究了大型语言模型(LLMs)是否能够生成用于幽默检测的合成数据。我们对现有的人类数据集进行了基准测试,并展示了当前的 LLMs 在判断幽默性和幽默检测的下游任务中,能够令人印象深刻地去除笑话。我们还将我们的方法扩展到了一个混合编码的英文 - 印地语幽默数据集,发现 GPT-4 的合成数据得到了双语注释者的高评价,并为幽默分类器提供了具有挑战性的对抗性例子。
Feb, 2024
本研究提出了一个基于机器学习的新型幽默挖掘方法,通过结合心理学、语言学与自然语言处理的最新进展,利用一万余篇滑稽论文构建数据集,成功实现自动检测幽默科学论文的任务,并有望在科学研究中发挥重要作用。
Jun, 2021
本文提出并评估了六种深度学习模型,包括 BERT(和 RoBERTa),MultiHead Attention,co-attentions 和 transformers,结果表明我们的基于 transformer 的模型可以提高自动化的欺骗检测性能(+2.11%的准确率),并显示与真实和欺骗陈述中 LIWC 特征使用相关的显着差异。
Oct, 2022
通过对具有矛盾叙事的漫画展开研究,本文引入了 YesBut 评估基准,旨在评估人工智能在识别和解释具有幽默矛盾的漫画方面的能力。通过广泛的实验和分析,我们发现即使是最先进的模型在此任务上仍然落后于人类表现,为人工智能在理解人类创造性表达方面的当前限制和潜在改进提供了见解。
May, 2024
本文介绍了我们对 SemEval-2022 任务 6:针对英语和阿拉伯语的讽刺检测及其五个子任务的参赛作品。我们使用基于 transformers 的深度学习技术来检测讽刺,数据集来自推特,数据预处理对于任务至关重要,我们的排名在四个子任务中保持稳定,这说明我们使用的模型和技术具有鲁棒性和稳定性。
Mar, 2022
本文介绍了一种新的 Passau-SFCH 数据集,用于幽默和其情感和方向的自动分析,研究结果表明,对于幽默和其情感的自动分析,面部表情最有潜力,而文本特征最适合模拟幽默方向。
Sep, 2022