BriefGPT.xyz
Ask
alpha
关键词
llm inference speedup
搜索结果 - 1
SLEB: 通过冗余验证与消除优化 Transformer 块的流程化 LLMs
利用 SLEB 方法,通过消除多余的 transformer 块来优化大型语言模型的效率,加速模型的推断过程,同时不损害模型的语言能力。
PDF
5 months ago
Prev
Next