提出一种新的算法来联合建模标签和工作者质量,从带有噪声的众包数据中学习,可优化有限的标注资源,解决如何从噪声工作者中学习以及如何分配标注预算来最大化分类器性能等问题。
Dec, 2017
提出了一种基于早期学习的新型噪声分类技术框架,使用半监督学习的目标概率和正则化项,防止深层神经网络过于依赖错误标注而导致的过拟合现象。测试结果表明,该方法在多个标准基准数据集和实际数据集上均能达到与现有先进技术可比的鲁棒性。
Jun, 2020
本文提出了一种使用两个耦合的CNN从纯噪声观察中联合学习单个标注者的可靠性和真实分割标签分布的方法,该方法在三个公共医学影像分割数据集上表现良好,尤其是在注释数量较少且出现较大不一致性的情况下。
Jul, 2020
本研究提出一种学习时利用标签转移矩阵的方法,通过增加分类器的怀疑性来缓解标签错误纠正问题,并通过引入双头结构实现单个反向传播内每次迭代中高效地估计标签转移矩阵,结果表明该方法具有比现有方法更好的训练效率及相当或更好的准确性。
Nov, 2021
本文分析了在标签噪声率高或标注者/注释数量不足时,标签分离优于标签聚合的情况,并在众包产生的有噪声标签下通过理论分析和实证结果验证了这个结论。
Jun, 2022
通过多项标注者提供的多个嘈杂标签代替一个准确标签来学习分类器的研究:提出了一种基于标注者和数据样本的标签错误学习算法,并在MNIST、CIFAR-100和ImageNet-100上优于同类算法。
Jul, 2022
本文提出了一种与多个标注者的混淆有关的置信模型学习方法, 通过对分类器网络添加熵或基于信息的正则化器来鲁棒地估计给定仅含有噪声标签的预测, 并在MNIST、CIFAR-10和FMNIST等数据集上进行了实验, 实验结果表明该方法在各项指标上均优于或与其他现有方法表现相当。
Jan, 2023
本研究探讨了在医学影像分析中利用机器学习算法进行异常检测的方法,重点讨论了算法的性能如何取决于标注者的数量和标签的质量。我们提出了一种简单有效的方法,通过聚合不同水平标注者的标注来解决单个标注者主观性标注的问题。通过估计多个标注的隐藏标签并使用重新加权的损失函数来提高检测性能,我们旨在提高异常检测任务中预测模型的效率。本研究在一个真实的医学影像数据集上进行了评估,并超越了不考虑标注者间差异的相关基线。
Mar, 2023
本研究表明,使用交叉熵损失结合常用的正则化策略,如学习率下降、模型权重平均和数据增强等,可以优于最先进的方法,在处理学习噪声标签的挑战时,采用一种正则化策略组合可能比复杂的算法更有效。
Jul, 2023
本文研究了数据标注中的注释者标签不确定性对模型的泛化能力和预测不确定性的影响,并提出了一种基于感知质量的模型训练框架,通过生成多个标签来增强模型的可靠性。实验证明,使用该框架进行训练可以减轻注释者标签不确定性对模型泛化能力和预测不确定性的降低。
Mar, 2024