ICMLJun, 2022

使用仅限整数离散流的快速无损神经压缩

TL;DR本文提出了一种基于离散流和整数运算的高效神经压缩器,使用可学习的二进制门来消除推理过程中的冗余滤波器,在 ImageNet32 和 ImageNet64 上保持高压缩比的同时,使用 IODF 在 GPU 上的 TensorRT 实现实现推理速度比现有最快的神经压缩器快 10 倍。