多注释者深度学习：用于分类的概率框架

Apr, 2023

多注释者深度学习：用于分类的概率框架

Multi-annotator Deep Learning: A Probabilistic Framework for Classification

Marek Herde, Denis Huseljic, Bernhard Sick

TL;DR我们提出了一个名为 MaDL 的概率训练框架，其中联合训练了一个基础真实模型和一个注释者模型来解决多注释者监督学习中存在的嘈杂标签问题，并获得了最先进的性能。

Abstract

Solving complex classification tasks using deep neural networks typically requires large amounts of annotated data. However, corresponding class labels are noisy when provided by error-prone annotators, e.g., crowd workers. Training standard deep →

multi-annotator deep learning probabilistic training framework supervised learning annotator performance model neural networks

发现论文，激发创造

追求基础事实：在注释器噪声存在的情况下学习自信模型并估计不确定性

本文提出了一种与多个标注者的混淆有关的置信模型学习方法，通过对分类器网络添加熵或基于信息的正则化器来鲁棒地估计给定仅含有噪声标签的预测，并在 MNIST、CIFAR-10 和 FMNIST 等数据集上进行了实验，实验结果表明该方法在各项指标上均优于或与其他现有方法表现相当。

Jan, 2023

大规模图像标注的多模态多尺度深度学习

本文提出了一种新的多尺度深层模型来提取富有判别性的特征，能够表示从物体、场景到抽象概念的各种视觉概念，并引入标签数量预测辅助任务来明确估计给定图像的最优标签数量。在两个大规模图像注释基准数据集上进行了广泛的实验，结果表明我们的方法明显优于现有技术水平。

Sep, 2017

众包深度学习

本文提出了一种基于 EM 算法和众包技术的神经网络训练模型，能够直接从多个标注者的嘈杂标签数据中进行有监督学习，并能够捕捉不同标注者的可靠性和偏见，最终在多个领域获得了新的最优结果。

Sep, 2017

MEDL-U：基于证据深度学习的不确定性感知 3D 自动标注器

开发基于 Evidential Deep Learning (EDL) 的不确定性估计框架的第一个方法，通过引入 MEDL-U，该框架不仅生成伪标签，而且量化相关的不确定性。实验证明，使用 MEDL-U 训练的概率性探测器在 KITTI 验证集中的所有难度级别上超过之前的 3D 注释器的确定性探测器，并在 KITTI 官方测试集上实现了最先进的结果。

Sep, 2023

半监督学习中建模多个标注者的专业知识

本文提出了一种概率半监督模型和算法，可以从多个注释者的标记数据中学习，并利用未标记数据，将注释者模型用于估计真实标记和注释者变量专业知识。对各种情况进行了数值比较，并表明了该方法优于不使用未标记数据的多注释者方法及不使用多标记者信息的方法。

Mar, 2012

通过多位专家注释员提高医学图像分析中的物体检测：一项实证研究

本研究探讨了在医学影像分析中利用机器学习算法进行异常检测的方法，重点讨论了算法的性能如何取决于标注者的数量和标签的质量。我们提出了一种简单有效的方法，通过聚合不同水平标注者的标注来解决单个标注者主观性标注的问题。通过估计多个标注的隐藏标签并使用重新加权的损失函数来提高检测性能，我们旨在提高异常检测任务中预测模型的效率。本研究在一个真实的医学影像数据集上进行了评估，并超越了不考虑标注者间差异的相关基线。

Mar, 2023

通过正则化评估注释者混淆来从嘈杂的标签中学习

本文研究了如何解决多个注释器提供的有噪声的标签的问题，提出了一种同时学习个体注释器模型和真实标签分布的方法，并通过正则化项促进收敛于真实注释器混淆矩阵的方法，在图像分类任务上实验结果表明，该方法能够估计注释器的技能并表现出良好的性能。

Feb, 2019

基于单个实例的自然语言标注者可靠性建模

本文提出了一种无监督的概率模型来处理二元和多类标签，自动评估每个标注者的实例可靠性和每个实例的正确标签。实验结果表明，该方法不仅可以准确评估不同实例上的标注者可靠性，而且在预测正确标签和检测最不可靠的标注者方面也能够实现优于现有技术的性能。

May, 2019

不充足注释下的多域学习

本文介绍了一种名为多领域对比学习（MDCL）的新方法，以减轻不充分注释对传统 MDL 方法的影响，该方法旨在捕获来自标记和未标记数据的语义和结构信息，通过在不同领域的共享和私有空间中分别对其进行处理。实验结果表明，MDCL 相对于各种共享 - 私有模型（SP models）都带来了明显的改进，而且还能在多领域主动学习中得到进一步应用，以获得更好的总体性能。

May, 2023

多标注者数据集的损失建模

通过多任务学习和基于损失的标签修正，我们提出了一种学习多样化意见更准确表达的方法，并展示了该方法在单个或多个注释者注释情况下改善预测性能的能力，同时对主观数据应用的附加标签噪音也表现出鲁棒性。

Nov, 2023