May, 2021

BatchQuant: 鲁棒量化器的量子化全架构搜索

TL;DR我们提出了 BatchQuant,这是一种稳健的量化器公式,可在数量少得多的 GPU 小时内训练出一种超过 10^{76} 个量化子网的紧凑超网,并首次无需重新训练即可无缝扩展一次权重共享 NAS 超网以支持任意超低位宽混合精度量化策略的子网。