公平主动学习

Jan, 2020

Fair Active Learning

Hadis Anahideh, Abolfazl Asudeh, Saravanan Thirumuruganathan

TL;DR本文提出了一种基于公平主义的主动学习算法，旨在平衡机器学习模型的准确性和公平性，并在多个基准数据集上验证了其有效性和效率。

Abstract

machine learning (ML) is increasingly being used in high-stakes applications impacting society. Therefore, it is of critical importance that ML models do not propagate discrimination. Collecting accurate labeled

machine learning discrimination active learning fairness algorithm

发现论文，激发创造

低数据环境下公正主动学习

在数据稀缺环境中，通过结合后验采样和公平分类子程序的创新主动学习框架，我们有效地提高了模型准确性并满足公平约束，证明了该方法在最大限度利用少量标注数据时的有效性，并对已有方法进行了改进。

Dec, 2023

算法决策的主动公平性

本研究提出了一种基于主动框架的公平分类方法，通过根据不同群体或个体的需求自适应获取信息来平衡分类性能差异，证明了该方法可以显著优于基于随机化的分类器。

Sep, 2018

积极学习是否可以预防公平性问题？

本文研究使用基于不确定性的主动学习启发式方法（如 BALD）训练的模型是否比使用独立同分布（i.i.d.）采样训练的模型在决策中对受保护类别具有更高的预测平等性，并探讨了算法公平性方法（如 GRAD 和 BALD）的交互作用，表明在大多数基准和度量标准上交互作用进一步提高了结果。

Apr, 2021

主动公平性审计

研究 ML 模型的审计算法，通过提出确定性算法和实用的随机化算法来评估 ML 模型的人口统计平等，以帮助监管机构应对机器学习的监管挑战，并为 AI 治理奠定更坚实的理论基础。

Jun, 2022

关于主动学习中的统计偏差：如何何时修正

本文探讨了主动学习中样本标注代价昂贵导致的偏差问题并提出了一种新的校正方法，解释了为何忽略这种偏差也能带来一些经验上的成功，尤其对参数众多的神经网络等少量数据训练情境下，这种偏差反而有益。

Jan, 2021

计算高效的主动学习

通过简单而有效的方法不仅可以降低主动学习过程的计算成本，还能保持模型性能，从而优化大规模数据集的标注效率。

Jan, 2024

AdaFair: 累积公平自适应提升算法

研究机器学习如何处理公平性和防止基于敏感属性的预测性歧视问题，并提出一种名为 AdaFair 的基于 AdaBoost 分类器的方法，该方法显式地处理类别不平衡并在维持分类准确性的同时优化公平性，实验证明其在平衡错误方面比现有的公平性方法表现显著好 25％。

Sep, 2019

主动学习：问题设置和最新发展

本文介绍了有监督学习中获取标记数据的高成本和获取大量未标记数据的轻松方法，以及通过自适应选择标记样本来获得高精度预测模型的主要问题设置和最近的研究趋势。重点介绍了选择从数据中进行标记的学习获取函数的研究、关于主动学习算法的理论工作和顺序数据获取的停止标准。介绍了材料开发和测量的应用示例。

Dec, 2020

走向可比较的主动学习

提供了一种公平比较不同任务和领域中算法的主动学习框架，并提出了一种快速有效的评估算法。汇总了在 3 个主要领域（表格、图像和文本）上使用的 6 种广泛应用的算法在 7 个实际数据集和 2 个合成数据集上的实证结果，并形成了领域特定的主动学习算法排名。

Nov, 2023

深度主动学习破除幻觉

该研究旨在评估目前基于最新学习方法下的图像分类的主动学习策略的有效性，并且在更实际的情况下验证了选择语义分割的方法，其提出了一种更合适的评估协议。

Dec, 2019