ICLROct, 2023

稀疏熵 - 瓦瑟斯坦回归强大的网络剪枝

TL;DR本研究提出了一种先进的神经网络剪枝技术,通过在计算经验 Fisher 信息矩阵(FIM)过程中巧妙处理嘈杂的梯度。我们介绍了一种基于几何属性的熵 Wasserstein 回归(EWR)模型,通过采用数据点之间的邻域插值实现噪声缓解。Wasserstein 距离的独特优势在于平衡噪声降低和协方差信息保留之间的关系。通过在各种网络上进行广泛实验证明,所提出的方法在网络剪枝算法中具有与先进方法相当的性能。当网络规模或目标稀疏度较大时,我们提出的方法在存在嘈杂梯度的情况下效果更为显著,可能来自嘈杂数据、模拟存储器或对抗攻击。值得注意的是,我们的方法在仅剩不到四分之一的网络参数的情况下,使 MobileNetV1 的准确度提高了 6%,测试损失提高了 8%。