May, 2023

MindGames: 利用动态认识模态逻辑针对大型语言模型的心灵游戏

TL;DR本文通过运用动态认知逻辑以生成更为复杂的问题,以及新颖的语言表述技术来表达这些问题,研究表明 70M 到 6B 和 350M 到 174B 的语言模型规模并不总是比随机投票更好,并且 GPT-4 表现出了更优秀的认知推理能力,但仍有待提高。