Jan, 2024

从4K到400K:用激活信标扩展LLM的上下文

TL;DR利用Activation Beacon插件来压缩语言模型的原始激活,从而使其在有限上下文窗口的情况下能感知更长的上下文,提高LLM的长文本处理能力。