非独立同分布数据下的半监督学习

ICLRApr, 2021

非独立同分布数据下的半监督学习

More Than Meets The Eye: Semi-supervised Learning Under Non-IID Data

Saul Calderon-Ramirez, Luis Oala

TL;DR本文研究了半监督深度学习中的语义数据集匹配，证明其在某些情况下甚至会降低最先进算法的性能，并提出了一种更可靠的选择无标签数据的定量匹配标准，即使用基于密度的不相似性度量在通用分类器的特征空间中进行。

Abstract

A common heuristic in semi-supervised deep learning (SSDL) is to select unlabelled data based on a notion of semantic similarity to the labelled data. For example, labelled images of numbers should be paired with unlabelled images of numbers instead of, say, unlabelled images of cars.

semi-supervised deep learning semantic data set matching performance simulation sandbox density based dissimilarity measures

发现论文，激发创造

针对分布偏移的图像分类半监督深度学习综述

本篇文章研究了半监督深度学习的最新方法，重点是针对标记和未标记数据集之间分布差异的情况设计的半监督深度学习模型，致力于解决传统深度学习流水线在实际使用环境下对数据的高需求，并希望鼓励社区应对该方面的挑战。

Mar, 2022

少样本零样本情境中的半监督学习

我们通过引入额外的熵损失构建了一个分类器，用于对来自已知和未知类别的数据进行分类，从而改进了现有的半监督学习方法在已知和未知类别的分类中的表现。通过在 CIFAR-100 和 STL-10 两个基准图像分类数据集上的实验证明，我们相对于现有的 SSL、开放集合 SSL 和开放世界 SSL 方法取得了巨大的改进。当标记数据非常有限（每个类别 1-25 个标记示例）时，进步最为显著。

Aug, 2023

朝着真实的半监督学习

本文提出一种基于伪标签的半监督学习方法，能够处理 open-world SSL 问题，并通过样本不确定性和类别分布先验知识等手段，为已知和未知类别的未标记数据生成可靠的类别分布感知型伪标签。该方法在多种常用数据集上表现良好，特别是在 CIFAR-100，ImageNet-100 和 Tiny ImageNet 数据集上的表现显著优于现有的最先进技术。

Jul, 2022

专家 / 模仿网络混合：可扩展的半监督学习框架

本文提出了一个 semi-supervised learning (SSl) 的新方法：Mixture of Expert/Imitator Networks，该模型通过利用大量未标记数据来训练 imitator 网络模拟 expert 网络的标签分布，从而提高 text classification 任务的性能，实验结果表明该方法可适用于多种深度神经网络模型，并且性能随未标记数据的增加而提高。

Oct, 2018

深度半监督学习算法的实际评估

通过实现多种常用的 SSL 技术并在一系列实验中进行测试，研究发现简单基线方法的表现通常被低估，而 SSL 方法对标记和未标记数据的敏感性不同，当未标记数据集包含类外示例时性能可能会显著下降，因此我们提供了一个公共代码重现平台以帮助实现 SSL 技术在实际应用中的可行性。

Apr, 2018

一种半匹配的标签到图像翻译方法

本文提出了第一个半监督（半配对）的框架，用于标签到图像的翻译，使用输入重构任务并利用条件鉴别器来作为反向生成器，证明了所提出模型在标准基准测试中优于现有的无监督和半监督方法，同时使用更少的配对样本。

Jun, 2023

MixMatch: 半监督学习的整体方法

本研究提出了一种半监督学习算法 MixMatch，采用猜测低熵标签的方法，通过使用 MixUp 混合标记和未标记的数据来处理扩充后的未标注样例。实验结果表明，MixMatch 在许多数据集和标记数据量上都取得了大幅度的优越结果，同时也证明了 MixMatch 如何帮助实现更好的准确性和隐私权的权衡。最终，我们进行了消融研究来分离 MixMatch 的哪些组件对其成功最为重要。

May, 2019

SSDH：大规模图像检索的半监督深度哈希

本文提出一种半监督的深度哈希方法，通过同时保留语义相似性和基础数据结构来更有效地学习哈希函数。实验结果表明，该方法在 5 个常用数据集上优于现有的哈希方法。

Jul, 2016

未标记数据的开放集半监督学习中的探索和利用

本文探讨半监督学习中的开放集问题，提出了基于原型的聚类和识别算法以及基于重要性采样的方法，针对多项挑战性基准测试取得最优成果。

Jun, 2023

半监督和无监督深度视觉学习：一项综述

本文综述了针对可视化识别问题的先进深度学习算法在半监督学习和无监督学习范式下的研究进展，提出了统一的分类方法，并分析了它们在不同学习场景和计算机视觉任务中的设计原理及应用，最后探讨了 SSL 和 UL 中的新趋势和挑战。

Aug, 2022