Nov, 2022
数据低基变压器:基于梯度裁剪的重要实例查找
BERT on a Data Diet: Finding Important Examples by Gradient-Based Pruning
Mohsen Fayyaz, Ehsan Aghazadeh, Ali Modarressi, Mohammad Taher Pilehvar, Yadollah Yaghoobzadeh...
TL;DR在该论文中,我们首次将 GraNd 和 EL2N 这两个用于发现重要样本的梯度基于评分指标,应用于 NLP,证明了我们可以通过剪枝训练集中最高 GraNd / EL2N 得分的一小部分样本,不仅可以保持测试准确性,而且可以超越它。