May, 2022

结构化、灵活、鲁棒:针对超出分布推理任务对大型语言模型进行基准测试和改进,以实现更类似于人类的行为

TL;DR人类语言在思维和学习结构方面发挥重要作用。本文提出了一个挑战测评与深度学习语言模型相比人类表现的基准,并通过提供结构化符号推理模块来拓展深度学习语言模型,以使其更符合人类推理。实验表明,在语言表达能力、泛化能力等方面,人类远远优于 LLMs,这说明混合 AI 模型具有更接近人类推理的潜力。