Nov, 2022

数据低基变压器:基于梯度裁剪的重要实例查找

TL;DR在该论文中,我们首次将 GraNd 和 EL2N 这两个用于发现重要样本的梯度基于评分指标,应用于 NLP,证明了我们可以通过剪枝训练集中最高 GraNd / EL2N 得分的一小部分样本,不仅可以保持测试准确性,而且可以超越它。