Jun, 2024

SinkLoRA:增强效率与聊天能力的大型长文本语言模型

TL;DR扩展Transformer模型以适应更长的序列长度是一项关键挑战,本文提出了SinkLoRA作为应对策略,通过改进工作分配和应用高效的缓存压缩算法来提高模型性能。