生成式对抗少数族裔过采样
本研究提出了一种使用生成对抗网络来处理视觉数据集中类别不平衡问题的方法,通过在原有网络中加入分类器网络和一些附加条件,实现了在极端视觉分类任务上的最佳表现。
Dec, 2020
本文提出了一种端到端的深度生成分类器,通过使用领域约束自编码器作为生成器的先验来解决类不平衡问题,并使用判别器和分类器进行对抗学习,实验结果验证了该方法在处理高维类不平衡分类问题方面的卓越性。
Sep, 2022
通过迭代数据混合的马尔科夫决策过程(MDP)来解决不平衡数据集的问题,并通过使用数据扩充策略训练一个数据扩充策略并设计一种奖励信号,探索分类器的不确定性并鼓励性能提升,不考虑分类器的收敛,从而展示了解决具有不同类别少数样本的不平衡数据集的潜力和前景。
Aug, 2023
本文分析了大量过采样方法,并提出了一种新的基于隐藏部分多数类样本进行比较的过采样评估系统。我们的实验证明,所有研究过的过采样方法生成的少数类样本最有可能是多数类。因此,我们认为当前形式和方法的过采样不可靠,并在真实世界应用中应避免使用。
Feb, 2022
本文提出了一种基于对抗训练的分类器训练框架,可以处理不平衡数据,并通过给优势类别的样本加权来提高判别器的分类能力,同时也可以扩展到图形表示学习等其他问题。实验结果表明,相比现有的方法,本方法在不平衡数据分类和图形链接预测等任务中表现更优。
Nov, 2018
本文提出了 Deep Over-sampling(DOS)方法,它通过显式的、受监督的表示学习扩展了合成过采样方法,以利用卷积神经网络获取的深度特征空间,并通过 CNN 的训练和更新目标的迭代过程,使嵌入之间的类内方差较小,从而提高了深度表示的判别力。实验证明,DOS 框架不仅能够更好地解决类别不平衡问题,而且在标准平衡环境下还能提高 CNN 的性能。
Apr, 2017
本研究通过组合神经网络分类器和生成对抗网络技术提出了一种联合数据集修复策略,用于解决数据集不平衡所导致的性能下降和数据偏差问题,实验证明这种方法可以提高分类器和生成对抗网络的鲁棒性。
Aug, 2020
本研究通过生成合成数据来平衡少数类别数据,以探究类别不平衡数据对深度学习模型的影响。我们提出一种优先选择高信息熵样本的技术,通过最大化生成合成样本在其类别正确区域的概率来增强机器学习算法的准确性和效率。实验结果显示我们技术在增强深度学习模型方面表现出卓越性能。
Jan, 2024
本文介绍了一种从不平衡数据集中构建分类器的方法,通过在少数类过抽样和多数类欠抽样的组合使用,可以在 ROC 空间中实现比 Ripper 方法和朴素贝叶斯更好的分类器性能。
Jun, 2011
本文提出了一种基于聚类的过采样方法(Clustering Based Oversampling),该方法利用少数派样本与其聚类中心点之间的距离来生成新的少数派样本,它在不影响多数派学习的基础上,利用少数派样本的分布结构改善了在类别不平衡数据上的学习,并通过采取措施以防止异常值产生和过度拟合。深度神经网络实验结果表明,与其他合成数据采样技术相比,该方法在不同数据集上的评估指标上表现更好。
Nov, 2018