May, 2022

将多张小票叠加为一张:稀疏神经网络训练的性能提升器

TL;DR本文提出了一种用有限的训练资源制造多个性价比高的稀疏神经网络子网络,并将它们叠加在一起形成一个更加强大的子网络的新型稀疏训练方法 Sup-tickets,该方法可以同时满足在标准训练时间内有效地生成多个低损失子网络和有效地将这些低成本子网络叠加成一个更强的子网络的两个愿望。在CIFAR-10/100和ImageNet等各种现代架构上展示了 Sup-tickets 的一致性性能改进。