Dec, 2022

当不应信任语言模型:探究参数式与非参数式记忆的有效性和局限性

TL;DR此论文通过在新的问题 / 答案(QA)数据集 PopQA 上对 10 个模型和 4 种增强方法进行大规模的知识探测实验,旨在了解大型语言模型 (LMs) 在记忆事实知识方面的优劣,发现 LMs 在纽约市场上的市场地位相对较低,而检索增强的 LMs 在不需要检索的情况下可以显著地改善性能,并降低推理成本。