Sep, 2019

Q-BERT: 基于 Hessian 的 BERT 超低精度量化

TL;DR本文通过使用 Hessian 信息对 BERT 模型进行精细调整的广泛分析,提出了一种超低精度量化 BERT 模型的新方法,并对 SST-2、MNLI、CoNLL-03 和 SQuAD 等多项下游任务进行了广泛的测试 ,证明我们的新方法实现了与基线相当的性能。