Jul, 2023

迷失在中间:语言模型如何使用长上下文

TL;DR我们分析了语言模型在多文档问答和键值检索两个任务中的性能,发现当相关信息出现在输入上下文的开头或结尾时,性能通常最高,而在长上下文中访问相关信息时性能显著下降。此外,随着输入上下文的增长,性能显著降低,即使是专门用于长上下文的模型也如此。我们的分析对语言模型如何利用输入上下文提供了更好的理解,并为未来的长上下文模型提供了新的评估协议。