Mar, 2024

Auto-Train-Once:来自零的控制器网络引导的自动网络剪枝

TL;DR我们提出了 Auto-Train-Once(ATO)算法,旨在自动减少深度神经网络的计算和存储成本,通过训练目标模型同时利用控制器网络作为架构生成器来指导目标模型权重的学习,并利用新颖的随机梯度算法增强模型训练和控制器网络训练之间的协调,从而提高剪枝性能。在本文中,我们提供了全面的收敛分析和大量实验,结果表明我们的方法在各种模型架构(包括 ResNet18、ResNet34、ResNet50、ResNet56 和 MobileNetv2)以及标准基准数据集(CIFAR-10、CIFAR-100 和 ImageNet)上实现了最先进的性能。