Mar, 2022

基于自适应阈值的标签噪声数据鲁棒优化方法:自适应 k

TL;DR本文研究了在含有标签噪音的数据集上,SGD 算法的优化过程会受到噪音样本的影响,从而导致结果不可靠。作者提出了一种名为 Adaptive-k 的替代方法,该方法在优化过程中选择损失小于一个阈值的样本,而不是使用所有的样本。通过理论分析和实验结果,作者表明采用 Adaptive-k 方法可以得到与去除噪音样本的 oracle 模型相近的性能。Adaptive-k 方法简单而有效,不需要事先知道噪音比率,不需要额外的模型训练,也不会显著增加训练时间。