EMNLPSep, 2020

TernaryBERT: 知识蒸馏感知的超低比特 BERT

TL;DR本文提出 TernaryBERT,在 fine-tuned BERT 模型中采用了三元权重化,通过近似法和损失感知方法研究了 BERT 不同部分的三元化粒度,并在训练过程中利用知识蒸馏技术来减少低位容量引起的精度下降,实验证明 TernaryBERT 不仅优于其他 BERT 量化方法,而且在 14.9 倍的情况下与全精度模型性能相当。