Sep, 2023

通过层级目标低秩分解加速 Resnet 架构

TL;DR通过使用低秩分解在网络层上应用压缩,本研究旨在研究压缩神经网络以提高训练和推理速度。我们的研究证明,为了加速,压缩方法应该考虑底层硬件,并进行分析以选择要压缩的层。通过对 ResNet50 的压缩和在全图像数据集 ImageNet-ILSVRC2012 上的训练的案例研究,我们展示了我们的方法的优势。我们在两个不同的硬件系统 Nvidia V100 和 Huawei Ascend910 上进行了测试。通过针对硬件进行压缩,Ascend910 上的训练加速度为 5.36%,Ascend310 上的推理速度为 15.79%,与原始未压缩模型相比仅有 1% 的精度下降。