ICCVOct, 2021

Sub-bit 神经网络:学习压缩和加速二进制神经网络

TL;DR介绍了一种基于子位二值化的神经网络设计,通过针对二值卷积核子集训练,使用随机采样和优化步骤来调整这些子集,从而压缩和加速二值神经网络的模型。实验证明,该方法在图像识别基准和 FPGA 硬件部署上具有巨大潜力,可以在适度降低识别准确度的情况下实现运行时间加快和模型压缩。