众包深度学习

AAAISep, 2017

Deep learning from crowds

Filipe Rodrigues, Francisco Pereira

TL;DR本文提出了一种基于 EM 算法和众包技术的神经网络训练模型，能够直接从多个标注者的嘈杂标签数据中进行有监督学习，并能够捕捉不同标注者的可靠性和偏见，最终在多个领域获得了新的最优结果。

Abstract

Over the last few years, deep learning has revolutionized the field of machine learning by dramatically improving the state-of-the-art in various domains. However, as the size of supervised artificial neural networks

deep learning crowdsourcing neural networks reliability annotators

发现论文，激发创造

学习从众的标签选择方法

使用 Learning from Crowds 框架中的 Label Selection Layer 方法，通过选择性网络确定是否使用工人的标签进行训练，提供了一种有效的解决 Crowd annotations 中的标签噪声问题的方法。实验证明该方法在几乎所有的监督学习问题中都能获得与或优于当前最先进的方法相当的性能。

Aug, 2023

深度学习对大规模标签噪声具有强韧性

本研究证明，基于深度神经网络的图像分类模型可以从含有数量远多于准确标签的训练数据中进行有效学习，表现出良好的测试性能提升，这种学习需要增加数据集大小作为代价。

May, 2017

利用众包标签分布训练面部表情识别的深度网络

本文演示如何使用深度卷积神经网络 (DCNN) 从嘈杂的标签中学习，并以面部表情识别为例。通过比较多数投票，多标签学习，概率标签绘制和交叉熵损失四种方法来利用多个标签，我们发现传统的多数投票方案表现不如完全利用标签分布的最后两种方法。此外，我们还向研究社区共享了一组多标签面部图像数据集。

Aug, 2016

从含有噪声的带有单标签数据中学习

提出一种新的算法来联合建模标签和工作者质量，从带有噪声的众包数据中学习，可优化有限的标注资源，解决如何从噪声工作者中学习以及如何分配标注预算来最大化分类器性能等问题。

Dec, 2017

深度神经网络中的噪声标签学习：综述

本文综述了深度学习中标签噪声的学习问题，提供了 62 种最新的鲁棒训练方法，并系统性比较了六个评估指标。同时，分析了噪声估计率和评估方法，并提出了未来的几个研究方向。

Jul, 2020

群体参与：一种弱监督深度学习框架用于从 Web 数据中学习

本文介绍了一种鲁棒性强的、端到端的深度弱监督学习框架，该框架通过随机分组和注意力机制来有效减少 Web 图片注释的负面影响，实现了对嘈杂标签的有效抑制和准确图像标注，实验证明了该方法的卓越性能。

Nov, 2016

基于群众标注的多视角知识蒸馏用于领域外泛化

本文提出了新的方法以通过温度调节和 Jensen-Shannon 中心法从众包注释中汇总多个视角的分布，从而获得软标签。我们展示了这些聚合方法在四项自然语言处理任务中表现出最佳或接近最佳的性能，同时还验证了这些方法在任务不确定性估计上表现最佳。

Dec, 2022

从含有噪声标签的数据中学习如何学习

本文提出一种噪声容忍的训练算法，其中在传统梯度更新之前进行元学习更新来模拟实际训练。通过生成合成噪声标签进行训练，该元学习方法训练模型，以便在使用每个设置的合成噪声标签进行一次梯度更新后，模型不会过度拟合特定的噪声，从而提高深度神经网络的性能。

Dec, 2018

多智能体下分布式深度神经网络学习

提出了一种基于跨数据源的深度神经网络训练技术，旨在解决在健康医疗和金融等领域中标记数据和计算资源的短缺问题，并可以在数据敏感应用程序中进行分布式训练。

Oct, 2018

众包数据库的主动学习

本研究提出一种将机器学习与众包数据库结合的主动学习算法，以实现众包应用程序的可扩展性，并通过实验证明：相比于以往的主动学习方案，我们的方法平均只需要人类标记 1-2 个数量级的数据集就能实现与随机采样相同的精度。

Sep, 2012