CVPRJun, 2024

通过数据驱动的频谱视角修剪在视觉模型中发现彩票票据

TL;DR神经网络修剪能够减少深度学习模型训练之前的计算成本和内存需求。我们专注于该框架,并提出了一种新的初始化修剪算法,利用神经切向核(NTK)理论将稀疏网络的训练动态与密集网络对齐。我们介绍了如何考虑 NTK 光谱中通常被忽视的数据相关部分,并通过将神经网络分解为单个路径来获得 NTK 迹的解析上界。这导致我们的 Path eXclusion (PX) 方法,一种旨在保留对 NTK 迹影响最大的参数的预测性修剪方法。PX 能够在高稀疏程度下找到优秀的路径,大大减少额外的训练需求。应用于预训练模型时,它提取出可用于多个下游任务的子网络,性能可与密集模型媲美,但具有大量成本和计算节约。