BriefGPT.xyz
大模型
Ask
alpha
关键词
sparse activation
搜索结果 - 3
小型语言模型中实现稀疏激活
我们在小型语言模型(SLMs)中实现了稀疏激活,并通过新的归因测量指标以达到精确的稀疏激活,实验证明我们的方法可以在只损失 < 5% 的模型准确性的情况下实现 80% 的稀疏化比率,可与大型语言模型(LLMs)中实现的稀疏激活相媲美。
PDF
a month ago
SkillNet-NLG: 一种稀疏激活法的通用自然语言生成器
我们介绍了 SkillNet-NLG,一种稀疏激活的方法,可以处理多种自然语言生成任务。该方法与传统的密集模型不同,SkillNet-NLG 仅选择激活与任务相关的参数,这由一组预定义的技能控制。实验结果表明,SkillNet-NLG 可以
→
PDF
2 years ago
M6-T:探索稀疏专家模型及其进展
本文研究了稀疏专家模型中的关键因素,提出了专家原型法以改善模型质量,同时将模型规模扩大到 1 万亿参数,实现了与 TPU 相同的加速。
PDF
3 years ago
Prev
Next