BriefGPT.xyz
Oct, 2024
ACER:通过检索实现自动语言模型上下文扩展
ACER: Automatic Language Model Context Extension via Retrieval
HTML
PDF
Luyu Gao, Yunyi Zhang, Jamie Callan
TL;DR
本研究解决了当前通用长上下文模型在实际长上下文处理任务中的不足。我们提出了一种自动数据合成管道,模仿人类信息处理的方法,通过短上下文模型生成任务特定的数据,从而提升其长上下文能力。实验结果表明,这种方法在实际任务中超越了现有的长上下文模型和数据合成管道。
Abstract
long-context modeling
is one of the critical capabilities of language AI for digesting and reasoning over complex information pieces. In practice, long-context capabilities are typically built into a pre-trained
languag
→