Oct, 2018

用于快速部署的卷积神经网络后训练 4 位量化

TL;DR本研究提出了第一种实用的 4 位后训练量化方法,不涉及训练经过量化模型(微调),也不需要完整数据集的可用性。我们针对激活和权重的量化提出了三种互补方法,以在张量层面上最小化量化误差,并取得了几个百分点少于各种卷积模型现有技术水平基准值的准确性。