Apr, 2020

DynaBERT: 带有自适应宽度和深度的动态BERT

TL;DR本文介绍了一种名为DynaBERT的新型动态BERT模型,其通过选择自适应宽度和深度来灵活调整模型大小和延迟,以达到不同硬件性能的要求,并通过知识蒸馏过程,从全尺寸模型到小子网络,实现自适应宽度和深度。综合实验表明,它具有可比较的性能,并且在较小的宽度和深度下始终优于现有的BERT压缩方法。