缺失随机标签时的可靠半监督学习
本文针对有限标注信息下的半监督学习进行研究,分析了当前应用最广的半监督学习方法 FixMatch 在这种情况下的表现和局限,提出了一种利用自监督学习方法提供训练信号以及优化伪标签筛选过程的方案,并在 STL-10 数据集上得到了显著提高。
Dec, 2021
本篇文章研究了半监督深度学习的最新方法,重点是针对标记和未标记数据集之间分布差异的情况设计的半监督深度学习模型,致力于解决传统深度学习流水线在实际使用环境下对数据的高需求,并希望鼓励社区应对该方面的挑战。
Mar, 2022
本文提出了一种概率半监督模型和算法,可以从多个注释者的标记数据中学习,并利用未标记数据,将注释者模型用于估计真实标记和注释者变量专业知识。对各种情况进行了数值比较,并表明了该方法优于不使用未标记数据的多注释者方法及不使用多标记者信息的方法。
Mar, 2012
本文对多种半监督学习技术在不同数据集上进行实证研究,探讨标记数据和未标记数据的独立性、相关性、数量和噪声对学习效果的影响,同时针对样本选择偏差实现双变量 Probit 技术进行校正。
Sep, 2011
本文在贝叶斯框架下研究高维高斯混合模型的半监督学习,通过分析使用标记与未标记数据的最佳半监督方法和只使用标记数据的最佳全监督方法的差距,量化了未标记数据信息对性能的最佳提升。
Jul, 2019
本文提出了一种新颖的半监督学习范式,旨在解决标签不足和标签不准确的问题,该方法使用图来连接数据点以便在图边沿将标签信息从稀少标记示例传播到未标记的示例。实验证明,该方法在图像分类、文本分类和语音识别等领域有效降低标签误差,表现优于其他现有的半监督学习方法。
Feb, 2019
在真实应用中经常遇到标签模糊的数据,其中不同的标注者会给出冲突的类别标签。部分标签学习允许在这种弱监督的环境下训练分类器。虽然最先进的方法已经具有良好的预测性能,但它们经常受到错误校准的不确定性估计的影响。然而,拥有良好校准的不确定性估计在医学和自动驾驶等关键领域中尤为重要。本文中,我们提出了一种基于邻近 - 邻居的部分标签学习算法,利用了 Dempster-Shafer 理论。对人工和真实数据集的大量实验证明,所提出的方法提供了良好校准的不确定性估计,并取得了有竞争力的预测性能。此外,我们证明了我们的算法是风险一致的。
Feb, 2024
本文提出一种新的半监督分类方法,通过将无标签数据引入到分类模型中,使模型的下降边界可以与无标签数据的数量成比例而不需要假设簇的条件。经过实验证明这种方法的有效性。
May, 2016
通过理论和实验,我们证明了半监督学习可以显著提高对抗性鲁棒性,实验结果表明在 CIFAR-10 上使用 500k 未标记图像,使用自我训练方法可以超过最先进的对抗性鲁棒的准确度。在 SVHN 上,使用模型自身的额外的训练集可以提高 4 至 10 个百分点,与使用额外标签的提高量相差不大。
May, 2019