Oct, 2024

ACER:通过检索实现自动语言模型上下文扩展

TL;DR本研究解决了当前通用长上下文模型在实际长上下文处理任务中的不足。我们提出了一种自动数据合成管道,模仿人类信息处理的方法,通过短上下文模型生成任务特定的数据,从而提升其长上下文能力。实验结果表明,这种方法在实际任务中超越了现有的长上下文模型和数据合成管道。