May, 2024

解读并列: AI 模型能理解幽默的矛盾吗

TL;DR通过对具有矛盾叙事的漫画展开研究,本文引入了 YesBut 评估基准,旨在评估人工智能在识别和解释具有幽默矛盾的漫画方面的能力。通过广泛的实验和分析,我们发现即使是最先进的模型在此任务上仍然落后于人类表现,为人工智能在理解人类创造性表达方面的当前限制和潜在改进提供了见解。