警告标签不发两次：预算有限时，数量胜过质量的二元分类器比较

Feb, 2024

警告标签不发两次：预算有限时，数量胜过质量的二元分类器比较

Don't Label Twice: Quantity Beats Quality when Comparing Binary Classifiers on a Budget

Florian E. Dorner, Moritz Hardt

TL;DR我们研究了如何在给定一个模糊标签的预算的情况下，比较两个二元分类器的准确性。我们证明了一个与常规智慧相悖的定理，即如果目标是确定两个分类器中的更好者，则在更多样本上收集单个标签是最好的。我们的结果是基于 Cramér 定理的非平凡应用得出的，这是大偏差理论中的一项基本理论。我们还讨论了我们的工作对机器学习基准设计的影响，这颠覆了一些历史悠久的建议。此外，我们的结果提供了比 Hoeffding 界更优秀的样本大小界限。

Abstract

We study how to best spend a budget of noisy labels to compare the accuracy of two binary classifiers. It's common practice to collect and aggregate multiple →

noisy labels binary classifiers budget allocation majority vote sample size bounds

发现论文，激发创造

数量与质量：探究样本量与标签可靠性之间的权衡

研究在概率领域学习中标签质量的优化问题，提出了在有限训练预算下，是否应优先使用重采样策略提高训练数据的标签质量还是扩大数据集；并证明在人工标注的过程中这一策略可以取得更好的分类器性能，在此基础上提出了两种不同的验证方案。

Apr, 2022

从含有噪声的带有单标签数据中学习

提出一种新的算法来联合建模标签和工作者质量，从带有噪声的众包数据中学习，可优化有限的标注资源，解决如何从噪声工作者中学习以及如何分配标注预算来最大化分类器性能等问题。

Dec, 2017

是否聚合？在带有不同噪声标签下的学习

本文分析了在标签噪声率高或标注者 / 注释数量不足时，标签分离优于标签聚合的情况，并在众包产生的有噪声标签下通过理论分析和实证结果验证了这个结论。

Jun, 2022

清洗或标注：如何使用有限的数据采集预算

本文提出了一种通过在注释过程中专门清理高概率错误样本的方法，以优化注释过程，并在三种模型变化和四个自然语言处理任务上进行的实验证明，该方法在分配相同的有限注释预算时优于聚合注释和高级去噪方法。

Oct, 2021

利用不确定性估计来提高分类器性能

模型得分和不确定性对决策边界的选择有关，该研究提供了理论分析和经验证据来证明模型得分估计偏差依赖于不确定性和得分本身，通过动态规划和保序回归算法提出的方案在三个真实数据集上比传统的只使用模型得分方法，在高精确度边界下获得了 25％-40％的召回率提升，凸显了利用不确定性的好处。

Nov, 2023

利用带噪标签训练的深度神经网络及其应用

本文针对网络训练时噪声标签的问题，提出了一种基于交叉验证和合作训练策略的解决方法，成功提高了深度神经网络在合成和实际噪音数据集下的泛化性能。

May, 2019

球场学习：从粗略的组间比较中估算标签

利用约束比例而非标注样本估算标签的研究，对应用真实环境、情感分析和探索性分析二者进行了强力演示。

Jun, 2016

噪声标签的误差有界修正

本文介绍了针对大规模标注数据不可避免存在 label noise 问题时，通过使用 noisy classifiers 算法来提高模型鲁棒性，进而讲解了该算法的理论解释，并提出了一种基于该算法的标签校正方法，结合深度神经网络，成功提升了测试性能。

Nov, 2020

测试时间预算上的鲁棒文本分类器

提出一种通用且可解释的学习框架，以构建健壮的文本分类模型，在测试时间预算限制下实现与完整模型可比的准确性。该方法学习选择器来识别预测任务相关的单词，并将其传递给分类器进行处理。选择器与分类器一起进行训练，并直接学习与分类器相结合。我们进一步提出了一种数据聚合方案，以提高分类器的鲁棒性。我们的学习框架很普遍，可以与任何类型的文本分类模型结合使用。在真实数据上，我们展示了所提出的方法提高了给定分类器的性能，并在准确性性能稍微降低的情况下加快了模型的速度。

Aug, 2018

准确度指标的鲁棒性及其在带有噪声标签的学习中的启示

本文研究了多类分类中标签噪声的问题，证明准确度度量本身可以是健壮的，并探讨了噪声数据下的训练和验证问题，同时针对模型选择问题提出了一种新的框架 NTS，并提供了相应的代码。

Dec, 2020