Apr, 2023

辩证语言模型评估:对LLMs常识空间推理能力的初步评估

TL;DR通过对语言模型进行对话交互式评估,将其在常识推理中的功能边界在空间推理方面进行了定性研究,并提出了未来改进语言模型能力和系统化对话评估的建议。