ACLMay, 2020

schuBERT: 优化 BERT 的元素

TL;DR基于 Transformer 的模型 BERT 在多项任务上取得最先进的结果,但由于参数数量巨大,计算代价昂贵。本文提出了一种基于算法优化的轻量级压缩方案,成功地减少了模型中的参数数量,且在保证精度的情况下相比 BERT 模型取得了更好的性能。