从噪声数据中为深度学习优先选择信息丰富的特征和示例
通过选择性学习理论,我们提出了一种新的方法,在高噪声数据分布下学习和决策,并通过最小化这个损失函数来区分有用数据和无用数据进行预测。我们还描述了一个迭代算法,同时优化预测器和选择器,并在各种场景中评估了其实证表现。
Sep, 2023
提出了一种用于训练神经网络的框架,以识别和区分数据的预测和负面因素,并通过学习消除负面因素,从而实现对负面因素的不变性,从而实现对负面因素的不变性,并通过信息论框架和推导出的训练目标,实现了最先进的性能。
Dec, 2019
该论文提出了一种全新的训练深度神经网络的方法,在标签噪音的情况下拥有高稳健性,通过利用小的可信集合来估计样本权重和伪标签以重复使用它们进行监督训练。该方法在各种类型的标签噪声和大规模真实世界标签噪声数据集上取得了最新的最优表现。
Oct, 2019
该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架,并使用一个无向图模型来描述干净和嘈杂标签之间的关系,在监督学习过程中学习这个模型。该模型在图像标注问题上应用,并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。
May, 2017
This paper proposes a method to improve the robustness of deep learning models in the presence of noisy labels by utilizing unsupervised learning and cluster regularization.
Jul, 2023
利用深度神经网络记忆清晰样本更早的现象,发展一种统计学方法,根据集成学习动态数据中干净和嘈杂数据的差异,改善了噪声标记估计,噪声过滤和指导分类的方法。
Oct, 2022
提出了一种基于数据奇异值分解的噪声标签检测方法,即使用噪声数据与潜在表征之间的对齐度测量来过滤噪声实例,应用于半监督学习、噪声鲁棒性损失函数等方面,并在基准数据集上验证了其较基准算法更为优越的性能。
Feb, 2021
本文提出一种噪声容忍的训练算法,其中在传统梯度更新之前进行元学习更新来模拟实际训练。通过生成合成噪声标签进行训练,该元学习方法训练模型,以便在使用每个设置的合成噪声标签进行一次梯度更新后,模型不会过度拟合特定的噪声,从而提高深度神经网络的性能。
Dec, 2018
本文提出了一种元算法来解决因从不同来源挖掘数据而导致的噪声标签问题,具有更新时间和更新方式分离的关键思想,利用简单实现的方法,将著名数据集 LFW 和文本性别化服务相结合用于性别分类,得到了最先进的结果,并分析了算法的收敛性能。
Jun, 2017