Jun, 2020

BERT 失去耐心:早期退出的快速和稳健推断

TL;DR本文提出了一种基于 Patience 的 Early Exit 推理方法,该方法可以作为即插即用的技术应用于预训练语言模型,并同时提高其效率和鲁棒性,方法是在每个预训练语言模型层上配备一个内部分类器,动态地停止推理过程使得中间分类器的预测结果不再改变,从而减少模型的复杂度,产生更好的精度 - 速度平衡。在实验结果中,使用该方法对 ALBERT 模型进行优化,结果表明该方法能够预防模型过度思考和在预测阶段利用多个分类器,达到更好的精度 - 速度平衡。