关于 GAN 中的正无标记分类
本文提出一种新的半监督分类方法,通过将无标签数据引入到分类模型中,使模型的下降边界可以与无标签数据的数量成比例而不需要假设簇的条件。经过实验证明这种方法的有效性。
May, 2016
该论文介绍了一种用于正负标记样本不明确的情景下,从正样本和无标记样本中学习出二分类器的新方法 —— 使用变分原理的方法,可以直接从给定的数据中定量评估贝叶斯分类器的建模误差,并进一步提高该方法的鉴别性能和数值稳定性,还可以通过引入最大化分类间隔的损失函数来使方法更加有效。
Jun, 2019
本文介绍了使用正样本和未标注样本进行 PU 学习的方法,即使正样本在数据分布中不具有代表性,也可以通过只固定负类分布来解决正偏差问题。通过将负 - 未标注学习与未标注 - 未标注学习相结合或利用递归风险估计方法,可以解决正偏差问题。然后,作者提出一种通用的方法来解决 PU 风险评估的过度配合问题。实验结果表明,无论数据集如何,这两种方法都是有效的。
Feb, 2020
这篇论文研究并扩展了自监督预训练在受限标注数据上的应用,提出了一种新颖的 PU 学习目标正无标噪声对比估计(puNCE)以通过有限监督获得表示,实验证明 puNCE 在受限监督下持续优于现有无监督和监督对比基线。
Jun, 2022
本文介绍了一种新的思路,即尝试通过让生成对抗网络 (GANs) 不仅学会模拟目标分布的正样本,而且学会避免负样本,以更好地表示目标数据分布,加速生成器的训练过程。我们称其为 “Rumi 框架”。实验证明,该方法在 MNIST、Fashion MNIST、CelebA 和 CIFAR-10 数据集上的表现优于标准 GAN 和 LSGAN,并且具有更好的泛化能力。此外,我们同时将该方法应用于处理不平衡数据集中的类别不平衡问题,并在 FID 分数上表现出色。
Oct, 2020
本论文提出了一个双重投影生成对抗网络 (P2GAN) 模型,学习在数据匹配和标签匹配之间平衡的方法,并通过改善条件生成式对抗网络 (cGAN) 模型中的配对方法解决了分类困难的问题,实验结果表明其在多个真实数据集上具有良好的效果。
Aug, 2021
本篇研究提出正 / 无标签学习与对抗数据增强(PUDA)方法以完成知识图谱,同时解决误删和数据稀疏问题,并在实际数据集上展现较好的应用效果。
May, 2022
本文提出了一种名为正例与未标注多标签分类(PU-MLC)的新方法,通过在训练时直接丢弃训练集中的负标签来减少嘈杂的标签所带来的不良影响,并通过引入自适应重平衡因子和自适应温度系数来缓解标签分布中的灾难性不平衡和概率平滑问题。大量的实验证明了 PU-MLC 方法在 MS-COCO 和 PASCAL VOC 数据集上取得了显着的改进。
Jun, 2023
通过使用正样本 - 无标签学习和自动编码器等异常检测器,我们提出了一种正样本 - 无标签自动编码器,通过使用无标签数据和异常数据,我们可以近似正常数据的异常得分,从而能够在没有标记正常数据的情况下训练异常检测器来最小化正常数据的异常得分并最大化异常数据的异常得分。实验证明我们的方法在各种数据集上实现了更好的检测性能。
May, 2024