Jun, 2024

Chumor 1.0: 来自若知吧的真正有趣且具有挑战性的中文幽默理解数据集

TL;DR通过对 Ruo Zhi Ba 平台上的智力挑战和文化特定笑话进行注释,我们构建了一个名为 Chumor 的数据集,并通过 A/B 测试与两种先进的语言模型 GPT-4o 和 ERNIE Bot 进行人类解释评估,结果表明 Chumor 是对于 SOTA 语言模型也具有挑战性,而 Chumor 笑话的人类解释明显优于语言模型生成的解释。