Feb, 2021

BRECQ: 通过块重构推动后训练量化的极限

TL;DR本文介绍了一种名为 BRECQ 的新型 PTQ 框架,通过重构神经网络的组件来将 PTQ 的位宽降至 INT2,并将混合精度技术结合到框架中。对多种手工制作和搜索的神经体系结构进行了广泛的实验,证明了 PTQ 可以实现比使用 QAT 的 4 位 ResNet 和 MobileNetV2 更快的速度制作量化模型。