从噪声数据中为深度学习优先选择信息丰富的特征和示例

Feb, 2024

从噪声数据中为深度学习优先选择信息丰富的特征和示例

Prioritizing Informative Features and Examples for Deep Learning from Noisy Data

Dongmin Park

TL;DR我们提出了一个系统性框架，通过优化有信息的特征和示例来增强开发过程的每个阶段，以解决真实世界应用中的嘈杂特征和示例。

Abstract

In this dissertation, we propose a systemic framework that prioritizes informative features and examples to enhance each stage of the development process. Specifically, we prioritize →

informative features examples feature learning data labeling data selection

发现论文，激发创造

学习放弃无信息数据

通过选择性学习理论，我们提出了一种新的方法，在高噪声数据分布下学习和决策，并通过最小化这个损失函数来区分有用数据和无用数据进行预测。我们还描述了一个迭代算法，同时优化预测器和选择器，并在各种场景中评估了其实证表现。

Sep, 2023

不变表示学习的特征发现与分离

提出了一种用于训练神经网络的框架，以识别和区分数据的预测和负面因素，并通过学习消除负面因素，从而实现对负面因素的不变性，从而实现对负面因素的不变性，并通过信息论框架和推导出的训练目标，实现了最先进的性能。

Dec, 2019

从严重标签噪声中提炼有效的监督

该论文提出了一种全新的训练深度神经网络的方法，在标签噪音的情况下拥有高稳健性，通过利用小的可信集合来估计样本权重和伪标签以重复使用它们进行监督训练。该方法在各种类型的标签噪声和大规模真实世界标签噪声数据集上取得了最新的最优表现。

Oct, 2019

训练深度判别神经网络对抗标签噪声的鲁棒性

该论文提出了一种基于无标签干扰数据集训练深度卷积神经网络的新型框架，并使用一个无向图模型来描述干净和嘈杂标签之间的关系，在监督学习过程中学习这个模型。该模型在图像标注问题上应用，并在 CIFAR-10 和 MS COCO 数据集上展示出有效的标注效果和在训练中实现了减少标签噪声的效果。

May, 2017

对抗噪声标签的稳健特征学习

This paper proposes a method to improve the robustness of deep learning models in the presence of noisy labels by utilizing unsupervised learning and cluster regularization.

Jul, 2023

深度网络中共识的动态及噪声标签的识别

利用深度神经网络记忆清晰样本更早的现象，发展一种统计学方法，根据集成学习动态数据中干净和嘈杂数据的差异，改善了噪声标记估计，噪声过滤和指导分类的方法。

Oct, 2022

使用有噪标签的 FINE 样本学习

提出了一种基于数据奇异值分解的噪声标签检测方法，即使用噪声数据与潜在表征之间的对齐度测量来过滤噪声实例，应用于半监督学习、噪声鲁棒性损失函数等方面，并在基准数据集上验证了其较基准算法更为优越的性能。

Feb, 2021

从含有噪声标签的数据中学习如何学习

本文提出一种噪声容忍的训练算法，其中在传统梯度更新之前进行元学习更新来模拟实际训练。通过生成合成噪声标签进行训练，该元学习方法训练模型，以便在使用每个设置的合成噪声标签进行一次梯度更新后，模型不会过度拟合特定的噪声，从而提高深度神经网络的性能。

Dec, 2018

深度学习下存在噪声标签的图像分类：综述

本文介紹關於使用深度學習算法處理帶有噪聲標籤的問題，針對噪聲建立噪聲模型和使用魯棒損失、正則化等方法建立魯棒算法兩種子群進行了綜述。

Dec, 2019

将 “何时更新” 与 “如何更新” 分离

本文提出了一种元算法来解决因从不同来源挖掘数据而导致的噪声标签问题，具有更新时间和更新方式分离的关键思想，利用简单实现的方法，将著名数据集 LFW 和文本性别化服务相结合用于性别分类，得到了最先进的结果，并分析了算法的收敛性能。

Jun, 2017