Oct, 2023

融合然后压缩:从其路由策略中揭示高效 SMoE

TL;DR通过专家融合和神经元排列对信息进行压缩,MC-SMoE 模型实现了高效的神经网络学习,降低了内存和计算资源的需求。