Jun, 2023

稀疏模型汤:通过模型平均实现剪枝改进的配方

TL;DR本文介绍了一种稀疏神经网络模型的组合方法,称为稀疏模型汤。该方法使用迭代剪枝技术,通过在众多超参数配置中重新训练模型以获得相同的稀疏性,从而使得多个稀疏模型之间的参数能够平均并且相容,从而增强了这些模型的泛化能力。