Jan, 2021

KDLSQ-BERT: 一种结合知识蒸馏和学习步长量化的量化 BERT 模型

TL;DR提出了一种基于 KDLSQ-BERT 的新型量化方法,将知识蒸馏与学习步长量化结合,可在保持精度的同时减小模型大小并提高推理性能,实现了 14.9 倍的压缩率,并且在各种比特(如 2 比特至 8 比特)的量化情况下表现出色。