Jun, 2024

语言模型是纵横字谜的解答者

TL;DR使用大型语言模型解决填字游戏的挑战,展示了当前最先进的语言模型在解谜填字提示方面的显著能力,性能达到先前结果的 2-3 倍,还开发了基于这一性能的搜索算法,首次使用语言模型解决完整的填字方格问题,在纽约时报的填字游戏上实现了 93% 的准确率,研究表明语言模型与人类专家的性能差距更小。