缺失随机标签时的可靠半监督学习

Nov, 2018

缺失随机标签时的可靠半监督学习

Reliable Semi-Supervised Learning when Labels are Missing at Random

Xiuming Liu, Dave Zachariah, Johan Wågberg, Thomas B. Schön

TL;DR本文介绍了一种半监督学习的方法，采用生成模型与监督学习算法，放松了对未标记特征的约束，可提高分类器的可靠性，从而准确量化标签不确定度。

Abstract

semi-supervised learning methods are motivated by the availability of large datasets with unlabeled features in addition to labeled data. unlabeled data is, however, not guaranteed to improve →

semi-supervised learning unlabeled data generative model classification label uncertainty

发现论文，激发创造

纯净半监督学习：在只有很少标记图像的情况下进行半监督学习

本文针对有限标注信息下的半监督学习进行研究，分析了当前应用最广的半监督学习方法 FixMatch 在这种情况下的表现和局限，提出了一种利用自监督学习方法提供训练信号以及优化伪标签筛选过程的方案，并在 STL-10 数据集上得到了显著提高。

Dec, 2021

针对分布偏移的图像分类半监督深度学习综述

本篇文章研究了半监督深度学习的最新方法，重点是针对标记和未标记数据集之间分布差异的情况设计的半监督深度学习模型，致力于解决传统深度学习流水线在实际使用环境下对数据的高需求，并希望鼓励社区应对该方面的挑战。

Mar, 2022

半监督学习中建模多个标注者的专业知识

本文提出了一种概率半监督模型和算法，可以从多个注释者的标记数据中学习，并利用未标记数据，将注释者模型用于估计真实标记和注释者变量专业知识。对各种情况进行了数值比较，并表明了该方法优于不使用未标记数据的多注释者方法及不使用多标记者信息的方法。

Mar, 2012

利用已标记和未标记数据进行学习：技术和领域的实证研究

本文对多种半监督学习技术在不同数据集上进行实证研究，探讨标记数据和未标记数据的独立性、相关性、数量和噪声对学习效果的影响，同时针对样本选择偏差实现双变量 Probit 技术进行校正。

Sep, 2011

半监督高斯混合模型的渐近贝叶斯风险

本文在贝叶斯框架下研究高维高斯混合模型的半监督学习，通过分析使用标记与未标记数据的最佳半监督方法和只使用标记数据的最佳全监督方法的差距，量化了未标记数据信息对性能的最佳提升。

Jul, 2019

不充分和不正确监督下的学习

本文提出了一种新颖的半监督学习范式，旨在解决标签不足和标签不准确的问题，该方法使用图来连接数据点以便在图边沿将标签信息从稀少标记示例传播到未标记的示例。实验证明，该方法在图像分类、文本分类和语音识别等领域有效降低标签误差，表现优于其他现有的半监督学习方法。

Feb, 2019

不确定性感知的部分标签学习

在真实应用中经常遇到标签模糊的数据，其中不同的标注者会给出冲突的类别标签。部分标签学习允许在这种弱监督的环境下训练分类器。虽然最先进的方法已经具有良好的预测性能，但它们经常受到错误校准的不确定性估计的影响。然而，拥有良好校准的不确定性估计在医学和自动驾驶等关键领域中尤为重要。本文中，我们提出了一种基于邻近 - 邻居的部分标签学习算法，利用了 Dempster-Shafer 理论。对人工和真实数据集的大量实验证明，所提出的方法提供了良好校准的不确定性估计，并取得了有竞争力的预测性能。此外，我们证明了我们的算法是风险一致的。

Feb, 2024

基于正类和未标记数据分类的半监督分类

本文提出一种新的半监督分类方法，通过将无标签数据引入到分类模型中，使模型的下降边界可以与无标签数据的数量成比例而不需要假设簇的条件。经过实验证明这种方法的有效性。

May, 2016

无标签数据提高对抗鲁棒性

通过理论和实验，我们证明了半监督学习可以显著提高对抗性鲁棒性，实验结果表明在 CIFAR-10 上使用 500k 未标记图像，使用自我训练方法可以超过最先进的对抗性鲁棒的准确度。在 SVHN 上，使用模型自身的额外的训练集可以提高 4 至 10 个百分点，与使用额外标签的提高量相差不大。

May, 2019

弱监督学习的约束标注

本文提出了一种基于约束空间的弱监督学习方法，将不同的弱监督信号结合起来进行训练，在文本分类和图像分类任务中优于其他方法。

Sep, 2020