Oct, 2019

Q8BERT:量化 8 位 BERT

TL;DR本文介绍了如何在 BERT 的 fine-tuning 阶段进行量化感知的训练,以将 BERT 压缩 4 倍并加速推理速度。