Dec, 2020

BinaryBERT: 推进 BERT 量化极限

TL;DR本文提出了 BinaryBERT,一种采用权重二值化的方法将 BERT 压缩到极限。论文发现,二进制 BERT 比三进制的更难以直接进行训练,因此提出了三进制权重分裂来初始化 BinaryBERT 网络。实验结果表明,BinaryBERT 模型只有轻微的性能损失,同时体积缩小了 24 倍,达到了 GLUE 和 SQuAD 基准测试的最先进压缩结果。