BriefGPT.xyz
大模型
Ask
alpha
关键词
routing performance
搜索结果 - 1
ME-Switch: 大型语言模型的内存高效专家切换框架
ME-Switch 是一种用于 LLM 提供的高效内存专家切换框架,通过混合精度量化,选择性地对非显著输入通道进行极低位量化,同时保持显著通道完整,从而显著减少存储需求并保持性能;此外,我们还开发了一种路由方法,通过将模型选择问题转化为领域
→
PDF
21 days ago
Prev
Next