ICMLJun, 2022

利用权重重要性的置信上限对大型 Transformer 模型进行修剪

TL;DR以 UCB(置信上界)为基础的 importance estimation 的 PLATON 方法有效地解决了传统剪枝方法因 mini-batch 采样和复杂训练动态而产生的不确定性和稳定性问题,从而在自然语言理解、问答和图像分类等任务中取得了显著的稀疏性改善效果。