Feb, 2024

SLEB: 通过冗余验证与消除优化 Transformer 块的流程化 LLMs

TL;DR利用 SLEB 方法,通过消除多余的 transformer 块来优化大型语言模型的效率,加速模型的推断过程,同时不损害模型的语言能力。