从有偏选择标签到伪标签:一种期望最大化学习框架应对有偏决策
本论文探讨选择性标签下算法辅助决策学习的问题,介绍为什么标准方法无法有效处理选择性标签的普遍选择偏误问题,提出了一种数据增强方法,既可以利用专家一致性减轻选择性标签导致的部分盲目性,也可以经验验证学习是否会导致易受系统性歧视的不可靠模型。
Jul, 2018
本研究介绍了一种新的伪标记形式,作为期望最大化算法的清晰统计解释,并提出了一种基于原始伪标记的半监督医学图像分割方法 SegPL,证明了其在 2D 多类 MRI 脑肿瘤和 3D 二进制 CT 肺血管分割任务中的效力和可靠性。
Aug, 2022
该研究探讨了伪标记在半监督医学图像分割中的应用,提出了 Bayesian Pseudo Labels 这一伪标记的全面推广方法,并展示了该方法在三维肺血管、MRI 脑肿瘤和三维 MRI 脑肿瘤二元分割方面的应用。
May, 2023
在动态学习系统中,选择性标记会导致检查,即对一个或多个子组中分配的持续负面预测。我们正式化了检查,展示了它如何出现,并强调了检查检测的困难。我们考虑对检查的保障 - 救济和随机探索 - 两者都确保我们收集标签以观察到否则不会被观察到的点。结果技术允许来自被审查小组的示例进入培训数据并更正模型,我们的结果突显了检查的未测量危害,并证明了在一系列数据生成过程中缓解策略的有效性。
May, 2023
通过提出一种修剪方法,Decoupled Confident Learning (DeCoLe),来解决标签偏见问题,并在仇恨言论检测领域应用其性能,成功识别了偏见标签并超过其他方法。
Jul, 2023
本文提出了一种基于深度学习的端到端系统,利用嘈杂的众包标签,通过多个注释器特定的 label confusion 层和参数耦合的方式,与神经分类器同时学习标签纠正机制,并提出了 CCEM 的正则化变种,以增强目标模型参数的可识别性。
Jun, 2023
应对深度学习算法中的劳动密集型标注成为一个瓶颈,处理不完美的标签日益受到关注,并成为一个活跃的研究领域。我们解决了学习带有噪声标签的问题,将其形式化为在嘈杂数据中找到结构化流行体的任务。在这个框架中,我们提供了一个合适的目标函数和一个基于两个期望最大化(EM)循环的优化算法。与两个 EM 循环相关的分离网络合作优化目标函数,其中一个模型用于区分干净标签和损坏标签,而另一个模型用于修复损坏的标签。这种方法最终得到了一个非坍塌的学习带噪声标签的飞轮模型。实验结果表明,在多个标准基准测试中,我们的算法在各种类型的标签噪声下取得了最先进的性能,并有显著的优势。
Jan, 2024
我们提出了一种新的自训练框架,用于结合模型和数据集的不确定性信息,通过使用期望最大化 (EM) 平滑标签和全面估计不确定性信息,并设计一种基础提取网络从数据集中估计初始基础,然后通过不确定性信息将其转换为真实硬标签,以在重新训练过程中迭代更新模型和基础。在图像分类和语义分割的实验证明了我们的方法在可信自训练算法中具有优势,在不同数据集上可以获得 1-3 个百分点的改进。
May, 2024
该研究提出了一种名为 SCOPE 的半监督对比异常值去除伪期望最大化方法,旨在压制伪标签带来的混淆错误,改进基于 EM 迭代的半监督深度学习算法行为,在移除离群值后,SCOPE 同时还能够有效提高半监督学习的分类精度,进一步搭配一致性正则化实现了基于半监督 CIFAR-10 分类任务在 250 和 4000 个标记样本下的最高分类精度。
Jun, 2022
本文中,我们探讨了如何在正样本和未标注样本数据集的有选择偏差中进行有监督学习,并提出了一种基于经验风险的方法来加入标签机制和解决未知标签机制的情况,实验证明,即使在未知标签机制的情况下,考虑可能存在的选择偏差也会提高分类器的训练效果。
Sep, 2018