Nov, 2023

评估检索增强型大型语言模型在科学文件推理中的有效性

TL;DR本研究通过关键字检索对多种大型语言模型进行评估,发现这些模型在科学文档推理任务中会使用编造的证据来支持预测,利用科学语料库进行预训练无法减轻证据捏造的风险。