May, 2024

长上下文任务是否需要长LLMs?

TL;DR在这项工作中,我们认为虽然最近取得了一些进展,但长上下文语言模型(long-LLMs)的学习和部署仍然是一个具有挑战性的问题。我们提出了一个名为LC-Boost(长上下文引导器)的框架,该框架使得短上下文语言模型(short-LLM)能够以自主引导的方式解决长上下文任务。通过根据给出的任务自适应地访问和利用上下文,LC-Boost可以作为处理不同类型的长上下文处理问题的通用框架。我们从流行的长上下文基准中全面评估了不同类型的任务,在较小的资源消耗下,LC-Boost能够实现显著提高的性能。