通过在难样本上进行元学习以提高泛化能力

CVPRMar, 2024

通过在难样本上进行元学习以提高泛化能力

Improving Generalization via Meta-Learning on Hard Samples

Nishant Jain, Arun S. Suggala, Pradeep Shenoy

TL;DR学习重加权（LRW）方法用优化准则分配训练实例权重，以在代表性验证数据集上最大化性能。我们提出并形式化了在 LRW 训练中优化选择验证集的问题，以提高分类器的泛化能力。使用难以分类的实例作为验证集，在理论上与实证的有效性存在强烈的关联。我们提供了一种有效的算法来训练这种元优化模型，并提出了一种简单的两次训练启发式方法进行比较研究。我们证明相对于易用验证数据的 LRW，具有难度验证数据的 LRW 表现一致更差，从而验证了我们元优化问题的有效性。我们的算法在一系列数据集和域偏移挑战（Imagenet-1K，CIFAR-100，Clothing-1M，CAMELYON，WILDS 等）上优于广泛的基线，通过在 Imagenet 上使用 VIT-B 获得了约 1％的增益。我们还展示了在 LRW 的训练中使用自然难的示例（Imagenet-R/Imagenet-A）能够在干净和自然难的测试实例上分别提高 1-2％的性能。次要分析显示，在 LRW 框架中使用难度验证数据可以提高测试数据的边界，暗示了我们实证增益背后的机制。我们认为这项工作为监督学习环境中元学习的元优化开辟了新的研究方向。

Abstract

learned reweighting (LRW) approaches to supervised learning use an optimization criterion to assign weights for training instances, in order to maximize performance on a representative validation dataset. We pose

learned reweighting optimization criterion validation set classifier generalization meta-optimization

发现论文，激发创造

学习为鲁棒的深度学习调整例子的权重

该研究提出了一种基于元学习和梯度下降的新算法，来对训练样本进行权重分配，从而达到解决深度神经网络在训练集偏差和标签噪声方面的过度拟合问题，而不需要额外的超参数调整，并在少量有干净核准数据的情况下，实现了在类别不平衡和标签污染问题上的出色性能。

Mar, 2018

随机权重的合理有效性：多任务学习的试金石

本文提出随机加权方法（包括随机损失权重和随机梯度权重），并进行了收敛性分析和实证评估，结果表明随机加权方法具有可比拟的性能和更好的泛化能力，是多任务学习的重要基线方法之一。

Nov, 2021

抓住机遇：硬样本重新加权的连续训练提高 LLM 的推广能力

使用实例重新加权的分布鲁棒优化方法在大型语言模型的持续训练中有效地优化了样本保留，提高了语言模型的性能。

Feb, 2024

变质样本学习排名

本文提出了一种半监督的学生 - 教师模型 ——“fidelity-weighted learning”，通过模拟教师网络来根据标注品质的置信度调整每个样本在学生网络的参数更新中所占比重，从而在使用弱标注数据进行深度神经网络训练时取得比主流半监督学习方法更好的性能。此方法在文本排序任务上表现优异。

Jun, 2018

元重置中的关键样本选择学习

本研究提出了一种学习框架，将元样本选择问题通过严格的理论分析降低到加权 K 均值聚类问题中，提出了两种聚类方法 RBC 和 GBC 以解决 “样本权重不均匀” 问题，并在实际应用中得到了验证。

Feb, 2023

深度学习中学习重新加权示例的重新实现

通过元训练和在线权重逼近方法，本文旨在解决使用深度神经网络时出现的噪声标签和训练集偏差对模型表现造成的问题，并通过使用充满挑战的不平衡图像数据集进行皮肤癌检测的真实问题来验证这一方法。

May, 2024

用乘法重新加权进行神经网络鲁棒性优化

提出一种使用 MW 重新加权示例的神经网络优化方法，该方法在标签存在噪声的情况下稳健且可提高准确性，同时不会影响其对抗鲁棒性。

Feb, 2021

权值与保真度加权学习

本文提出了一种基于半监督的 “保真度加权学习” 方法，通过利用高质量数据的后验概率调节参数的更新，使用弱标记数据对深度神经网络进行训练，同时提高任务相关数据表示的可靠性。在信息检索和自然语言处理领域中，我们的方法优于现有的半监督学习方法，表明该方法能更好地利用强弱标签数据，提高模型性能。

Nov, 2017

通用重新加权为何不优于 ERM

本文介绍了一种名为广义重加权算法（GRW）的类别，它通过迭代地重新加权训练样本来更新模型参数。我们发现在采用 GRW 算法的过拟合模型下，所得到的模型与采用 Empirical risk minimization 得到的模型非常相似。此外，在 GRW 算法不使用小规则化方法的情况下，得到的结果也是不尽如人意的，我们需要更多的探索与研究。

Jan, 2022

噪声标签学习的元标签校正

本文提出了一种基于元学习的标签纠正框架（MLC），旨在解决数据训练集中标签嘈杂或不确定性等问题，通过调整权重甚至直接纠正嘈杂标签来优化训练。在文本分类等任务中验证了该方法的有效性。

Nov, 2019