BriefGPT.xyz
Ask
alpha
关键词
token-level attention
搜索结果 - 1
EMNLP
将专家合并为一体:提高混合专家的计算效率
本研究主要通过提出一种计算较为高效的方法 Merging Experts into One(MEO)来降低计算成本,并通过实验证明其优越性以及如何进一步提高效率和性能。
PDF
9 months ago
Prev
Next