EMNLPOct, 2023

ALCUNA:大型语言模型迎接新知识

TL;DR提出了一个名为 KnowGen 的方法来生成新知识,并引入了一个名为 ALCUNA 的基准来评估大规模语言模型在处理新知识方面的能力,发现它们在处理新知识的推理方面表现不佳,并探索了实体相似性对模型对实体知识的理解以及上下文实体的影响。