伪标签选择是一个决策问题

Sep, 2023

Pseudo Label Selection is a Decision Problem

Julian Rodemann

TL;DR伪标记、半监督学习、确认偏差、贝叶斯框架、决策理论

Abstract

pseudo-labeling is a simple and effective approach to semi-supervised learning. It requires criteria that guide the selection of pseudo-labeled data. The latter have been shown to crucially affect pseudo-labeling

pseudo-labeling semi-supervised learning confirmation bias bayesian framework decision theory

发现论文，激发创造

近似贝叶斯最优伪标签选择

本文介绍了一个拟会泛化误差的具有 Bayesian 框架的 pseudo-label 选择方法 (BPLS)，其使用解析近似来选择标签实例，并通过针对高维数据的实证评估来表明其优于传统的 PLS 方法。

Feb, 2023

关于伪标签的辩护：一种基于不确定性的半监督学习伪标签选择框架

本文提出一种基于不确定性的假标签选择框架，通过减少训练过程中的噪音来提高假标签的准确性，并可以生成负假标签用于多标签分类和负学习，相比于最近的半监督学习方法在 CIFAR-10、CIFAR-100、UCF-101 和 Pascal VOC 数据集上获得了很好的性能。

Jan, 2021

专家一致性存在下的有选择标签学习

本论文探讨选择性标签下算法辅助决策学习的问题，介绍为什么标准方法无法有效处理选择性标签的普遍选择偏误问题，提出了一种数据增强方法，既可以利用专家一致性减轻选择性标签导致的部分盲目性，也可以经验验证学习是否会导致易受系统性歧视的不可靠模型。

Jul, 2018

无法处理（肮脏的）真相：以数据为中心的洞察提高了伪标注

伪标记是一种使用少量标记样本来利用无标记数据的常用半监督学习技术。本研究提出了一种名为 DIPS 的数据特征化和选择框架，通过对学习动态的分析来改善伪标记方法，提高标记数据的质量，并展示了其在各种真实世界的表格和图像数据集上的应用和影响。综上所述，我们强调了在真实环境中数据为中心的伪标记方法的显著优势。

Jun, 2024

图数据中嘈杂伪标签的深入洞察

给出伪标记策略对图学习模型的影响的深入见解，通过错误分析证明伪标记错误受伪标记阈值的置信度和多视图预测的一致性的限制，并在收敛性属性上理论上说明的基础上，提出了一种谨慎的伪标签方法，通过对置信度最高且多视图一致的样本进行伪标签，从而改进了图学习过程，在链接预测和节点分类任务上优于其他伪标记策略。

Oct, 2023

一种通道集合方法：无偏差和低方差的伪标签对半监督分类至关重要

我们提出了一种轻量级通道级集成方法，用于将多个次优的伪标签有效地合并为理论上保证的无偏差和低方差的伪标签，该方法可轻松扩展到任何半监督学习框架，并在 CIFAR10/100 上显著优于现有技术，无论是在效果上还是效率上。

Mar, 2024

CroSel: 针对部分标签学习的自信伪标签交叉选择

本文提出了一种新的方法 CroSel 来解决部分标签学习（PLL）问题，利用深度模型的历史预测信息识别大多数训练样例的真实标签，并证明在基准数据集上 CroSel 优于之前的最先进方法。

Mar, 2023

面向半监督多标签学习的类别分布感知伪标记

本文提出 Class-distribution-Aware Pseudo Labeling (CAP) 方法，通过设计基于类感知阈值的规则学习框架来控制每个类别的伪标签的数量，并约束伪标签的类别分布接近真实分布，旨在解决半监督多标签学习问题。实验结果证明了 CAP 方法可以有效解决半监督多标签学习问题并提高泛化能力。

May, 2023

伪标记中选择性的无监督多源自由领域自适应的优势

该研究提出了一种利用信息论界限和特征对齐技术，将目标数据划分为伪标记子集和无标记子集以实现平衡的无监督域自适应方法，取得了比现有方法更好的性能表现。

Feb, 2022

一种使用正则化的置信度预测的不确定性感知伪标签选择框架

该研究提出了一种基于不确定性感知的伪标签选择框架，利用符合规范化算法产生的不确定性集合，修复了拟合不当的神经网络，从而减少嘈杂的训练数据。

Aug, 2023