提出了一种用于自学习开放世界类别(SSOC)的开放世界半监督学习方法,该方法可以明确地自学习多个未知类别,并通过与熵损失的结合设计了成对相似性损失来有效发现新类别,实验证明其在多个常见分类基准测试中优于现有最先进基线方法,特别是在 ImageNet-100 数据集上取得了显著的 22% 改进。
Jan, 2024
本文提出一种基于伪标签的半监督学习方法,能够处理 open-world SSL 问题,并通过样本不确定性和类别分布先验知识等手段,为已知和未知类别的未标记数据生成可靠的类别分布感知型伪标签。该方法在多种常用数据集上表现良好,特别是在 CIFAR-100,ImageNet-100 和 Tiny ImageNet 数据集上的表现显著优于现有的最先进技术。
Jul, 2022
该研究通过解决开放世界半监督学习中的假设假设和评估方法的问题,以扩展实用的开放世界半监督学习。
May, 2024
本文介绍了一种名为 OpenLDN 的方法,该方法针对半监督学习中存在的已标记数据和未标记数据来自于相同数据分布的困难,解决了开放世界半监督学习的问题,通过使用成对相似性损失来识别已知类别的样本,同时探测和聚类未标记数据中属于新类别的样本。实验结果表明,OpenLDN 在多个常用分类基准测试中都优于现有最佳方法,具有更好的准确性 / 训练时间折衷。
我们通过引入额外的熵损失构建了一个分类器,用于对来自已知和未知类别的数据进行分类,从而改进了现有的半监督学习方法在已知和未知类别的分类中的表现。通过在 CIFAR-100 和 STL-10 两个基准图像分类数据集上的实验证明,我们相对于现有的 SSL、开放集合 SSL 和开放世界 SSL 方法取得了巨大的改进。当标记数据非常有限(每个类别 1-25 个标记示例)时,进步最为显著。
Aug, 2023
这篇论文以图论为基础,提出了开放世界半监督学习的理论框架,并在此基础上设计了一种叫做 “光谱开放世界表示学习” 的算法,用于从已标记数据中推断出未知类别的未标记数据,并且能在已知和未知类别的聚类任务中提供可靠的理论保证。
Nov, 2023
研究了在实际场景中半监督学习的一个基本局限性,即未标注的测试数据往往包含以前在标注训练数据中遇到的类。为了解决这个问题,提出了 ORCA,一种端到端的深度学习方法来处理未知类别在标注和未标注数据中的不一致性,并在图像分类数据集和单细胞注释数据集上实验,表明在 ImageNet 数据集上 ORCA 对于已知类别的改善为 25%,对于未知类别的改善为 96%。
Feb, 2021
我们提出了一种新的端到端方法,名为 Prototypical Open-World Learning for Node Classification(POWN),它结合了图形半监督学习、自监督学习和伪标签技术,以零样本方式学习新类别的原型表示,实验证明 POWN 在基准数据集上的效果优于基准模型,准确率提高了最多 20%(小数据集)和 30%(大数据集).
Jun, 2024
本文提出一种针对医疗图像分类领域的半监督学习方法,借助于新领域、新标签的未标记数据,采用基于双路径异常值估计和变分自动编码器预训练的方法,实现更好的开放场景下的分类表现。在实验中,该模型在不同的医疗学习场景下 Demonstrate 了更好的分类表现。
Apr, 2023
本文提出了一种新的 Federatedopen-world Semi-Supervised Learning(FedoSSL)框架,可解决分布式和开放式环境下训练过程中异构分布未知类所导致的偏差,通过使用抑制损失增强聚合效果和校准模块确保知识传递一致,已在 CIFAR-10, CIFAR-100 和 CINIC-10 等真实数据集上进行了验证。
May, 2023