Oct, 2022

一次双赢的交易:朝着稀疏和鲁棒的预训练语言模型迈进

TL;DR本文研究细粒度子网络(SRNets)在预训练语言模型(PLMs)中的应用,尤其是在处理 Out-of-Distribution 数据方面的可行性。我们对 BERT 模型进行了广泛的实验,结果表明 SRNets 在不影响性能的情况下可以通过不同的训练和压缩方法来实现。此外,我们发现在 Out-of-Distribution 数据中可以获得稀疏且几乎无偏差的 BERT 子网络。最后,我们提出了解决 SRNets 搜索过程中高效性的方法,并提出了改善子网络性能的解决方案。