Feb, 2024
SLEB: 通过冗余验证与消除优化 Transformer 块的流程化 LLMs
SLEB: Streamlining LLMs through Redundancy Verification and Elimination of Transformer Blocks
Jiwon Song, Kyungseok Oh, Taesu Kim, Hyungjun Kim, Yulhwa Kim...
TL;DR利用 SLEB 方法,通过消除多余的 transformer 块来优化大型语言模型的效率,加速模型的推断过程,同时不损害模型的语言能力。