EMNLPMar, 2021

Cryptonite: 一份极度歧义语言的密语填字基准

TL;DR提出一个基于密码填字游戏的大规模数据集 Cryptonite,要求解出由语义、语法、音位上的文字玩偶和世界知识构成的密语线索,该任务难度高,当前模型的表现只有 7.6%,与基于规则的求解器的表现相当。