ECCVDec, 2022
QFT:通过快速联合微调所有自由度进行后训练量化
QFT: Post-training quantization via fast joint finetuning of all degrees of freedom
Alex Finkelstein, Ella Fuchs, Idan Tal, Mark Grobman, Niv Vosco...
TL;DR提出了一种硬件意识的量化网络参数化方法 —— 量化感知微调(QFT),可以通过联合端对端微调实现一步到位的量化,获得与最优结果相当的 4 位权重量化结果。