Feb, 2024

InfLLM: 揭示 LLM 对于无需训练的记忆理解极长序列的内在能力

TL;DR通过引入一种无需训练的基于内存的方法 InfLLM,使得大型语言模型 (LLM) 能够高效处理长序列并捕获远距离依赖关系。