Dec, 2024

大型语言模型真的不具备知识吗?挖掘隐藏在大型语言模型记忆中的知识

TL;DR本研究针对大型语言模型在问答任务中的表现不足,发现这些模型尽管有时输出错误答案,仍然保留着正确的知识。通过引入Hits@k这一新指标来评估知识的保留情况,并开发SkipUnsure方法利用未表达的知识,提高答案的准确性,实验结果显示在不同数据集上均有显著的准确性提升。