使用 Learning from Crowds 框架中的 Label Selection Layer 方法,通过选择性网络确定是否使用工人的标签进行训练,提供了一种有效的解决 Crowd annotations 中的标签噪声问题的方法。实验证明该方法在几乎所有的监督学习问题中都能获得与或优于当前最先进的方法相当的性能。
Aug, 2023
本文提出了一种基于 EM 算法和众包技术的神经网络训练模型,能够直接从多个标注者的嘈杂标签数据中进行有监督学习,并能够捕捉不同标注者的可靠性和偏见,最终在多个领域获得了新的最优结果。
Sep, 2017
本文提出了一种通过在注释过程中专门清理高概率错误样本的方法,以优化注释过程,并在三种模型变化和四个自然语言处理任务上进行的实验证明,该方法在分配相同的有限注释预算时优于聚合注释和高级去噪方法。
Oct, 2021
研究如何通过随机模型和基于子模块的贪婪算法来选择训练示例以教导学习者分类规则,并证明该策略具有较高的实用性和有效性。
Feb, 2014
本文研究了如何解决多个注释器提供的有噪声的标签的问题,提出了一种同时学习个体注释器模型和真实标签分布的方法,并通过正则化项促进收敛于真实注释器混淆矩阵的方法,在图像分类任务上实验结果表明,该方法能够估计注释器的技能并表现出良好的性能。
Feb, 2019
本文提出了一种新的众包模型,通过对每个实例和注释者的难度和能力进行分析,将注释噪声分解为公共噪声和个体噪声,并使用两种噪声自适应层实现端到端的学习解决方案来识别每个注释中的噪声来源。
Dec, 2020
本文分析了在标签噪声率高或标注者 / 注释数量不足时,标签分离优于标签聚合的情况,并在众包产生的有噪声标签下通过理论分析和实证结果验证了这个结论。
Jun, 2022
本文提出一种噪声容忍的训练算法,其中在传统梯度更新之前进行元学习更新来模拟实际训练。通过生成合成噪声标签进行训练,该元学习方法训练模型,以便在使用每个设置的合成噪声标签进行一次梯度更新后,模型不会过度拟合特定的噪声,从而提高深度神经网络的性能。
Dec, 2018
本文介绍了一种与分类器和训练算法共同作用的在线算法,通过其可提高在可学习类别上的整体性能
Nov, 2018
本文探讨半监督众包分类在标签约束和实例约束两种情况下的贝叶斯算法,该算法基于变分推断,可以比无监督众包分类更有效地对人工注释信息进行聚合,该算法在多个众包数据集上的分析和实证验证了其表现的可量化提升。