Dec, 2023

谨慎民主化:针对用户界面的开源自动机器学习工具中的公平特性需求

TL;DR人工智能在企业和组织中的作用越来越大,对人类用户的结果和利益产生了影响。自动化机器学习(AutoML)通过自动化重复性任务和基于数据的决策,简化了机器学习模型开发过程,使非专家也能够高效地构建高质量模型。然而,AutoML 工具在处理数据、模型选择和优化方法方面可能存在偏见。我们对用户界面的开源 AutoML 工具进行了实验研究(DataRobot、H2O Studio、Dataiku 和 Rapidminer Studio),以检查它们是否具备辅助用户开发公平感知机器学习模型的功能。实验涵盖了以下特征的评估考虑:了解用例上下文、数据表示、特征相关性和敏感性、数据偏差和预处理技术、数据处理能力、训练测试分离、超参数处理和约束、面向公平性的模型开发、解释性以及用户下载和编辑模型的能力。结果显示了特征在支持公平感知模型开发方面的不足。此外,结果还强调了在 AutoML 工具中确立某些促进公平性的基本特征的需要。