Apr, 2024

SemEval-2024 任务 9:BRAINTEASER:一个违反常识的新任务

TL;DR这篇论文介绍了一个基准测试以评估当前模型的横向思维能力,其中一个任务是测试系统的推理和横向思维能力,在竞赛中接受了 483 个团队的提交。