BriefGPT.xyz
大模型
Ask
alpha
关键词
cryptic crosswords
搜索结果 - 2
LLM 是否是出色的密码填字游戏解答者?
利用三种大型语言模型对神秘填字游戏进行基准测试,结果显示它们在这个任务上的表现远远低于人类。
PDF
4 months ago
EMNLP
Cryptonite: 一份极度歧义语言的密语填字基准
提出一个基于密码填字游戏的大规模数据集 Cryptonite,要求解出由语义、语法、音位上的文字玩偶和世界知识构成的密语线索,该任务难度高,当前模型的表现只有 7.6%,与基于规则的求解器的表现相当。
PDF
3 years ago
Prev
Next