Jun, 2022

专家稀疏混合模型的任务特定剪枝

TL;DR通过逐步删除稀有的 expert,将 Mixture-of-Experts 模型缩减为单一的 dense 模型,以提高计算效率并提供较快的推理速度而保留整体性能。