Jul, 2023

通过数据重要性学习改进检索增强的大型语言模型

TL;DR通过修剪或重新权重检索语料库,可以提高大型语言模型的性能,无需进行进一步训练。在某些任务中,甚至允许较小的模型(例如 GPT-JT)通过搜索引擎 API 进行扩展,胜过未使用检索增强的 GPT-3.5。此外,我们展示了在实践中可以高效地计算基于多线性扩展的权重(例如,对于包含 1 亿个元素的语料库,计算时间少于十分钟)