CVPRSep, 2021

DS-Net++:用于 CNN 和 Transformers 的高效推理的动态权重切片

TL;DR本文提出 DS-Net 和 DS-Net ++,两种基于动态权重分割的动态可裁剪网络。通过改变卷积神经网络 (CNNs) 或变压器 (transformers) 的滤波器数量和维度,以使其适应输入的不同难度水平,从而实现硬件有效的动态推理范式,同时保持网络参数静态和连续存储。与静态和动态模型压缩方法相比,大量实验表明,该方法具有更好的性能 (高达 6.6% 的提升)。