Jun, 2024

语言模型中学习事实的关键因素是什么?多元化多提示数据的多方面知识探测

TL;DR大型语言模型 (LLMs) 面临处理事实知识的问题,本研究通过知识探测框架 BELIEF (-ICL),从多个角度评估编码器型和解码器型大型语言模型对事实知识的理解能力,并利用多样的提示数据集 MyriadLAMA 进行可靠的评估,揭示了大型语言模型在学习事实方面的关键因素和基于提示的知识探测的局限性。