May, 2024

XL3M:一种基于分段推理的无需训练的 LLM 长度扩展框架

TL;DR用 XL3M 框架,将上下文分解成多个独立片段并通过衡量其与 “问题” 的相关性来构建一个简明的关键上下文,从而解决了大语言模型在处理超长文本时的泛化失败问题,并在推理任务中展现了卓越的性能。