Feb, 2022

稀疏性双赢:更高效的训练带来更好的鲁棒泛化

TL;DR本文提出两种新颖的在对抗训练期间注入适当稀疏形式的方法,即:通过利用最近的彩票假设的结果识别早期训练中出现的关键稀疏子网络来实现静态稀疏,以及通过在训练期间使稀疏子网络自适应调整其连接模式(同时保持相同的稀疏比率)来实现动态稀疏,并发现这两种新方法都可以显著缩减稳健泛化差距和减轻过度拟合,同时大大减少训练和推理的 FLOPs,实验证明此方法在各种数据集上有着显著作用,包括 CIFAR-10/100 和 Tiny-ImageNet。