关于具有公平性、隐私和监管规范的负责任机器学习数据集

Oct, 2023

关于具有公平性、隐私和监管规范的负责任机器学习数据集

On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms

Surbhi Mittal, Kartik Thakral, Richa Singh, Mayank Vatsa, Tamar Glaser...

TL;DR在当前人工智能时代，本研究讨论了负责任的机器学习数据集的重要性，并提出了一个评估数据集的负责任框架。通过公平性、隐私保护和合规性等方面的考虑，我们分析了超过 100 个数据集，发现没有一个数据集能免于公平性、隐私保护和合规性问题。我们对数据集的文档化提供了改进建议，并认为在全球范围内的数据保护法规定下，科学界的数据集创建方法需要修订。

Abstract

artificial intelligence (AI) has made its way into various scientific fields, providing astonishing improvements over existing algorithms for a wide variety of tasks. In recent years, there have been severe concerns over the trustworthiness of AI technologies. The scientific community

artificial intelligence trustworthy ai algorithms responsible machine learning datasets fairness privacy preservation

发现论文，激发创造

收集，测量，重复：负责任人工智能数据收集的可靠性因素

在这篇论文中，我们提出了一种负责任的人工智能（RAI）方法，旨在通过一套指标对数据进行迭代深入分析，从而引导数据收集并影响应用于现实世界中多样用户和内容的人工智能的数据鲁棒性评估。

Aug, 2023

关于公平感知机器学习数据集的调查

本文概述了应用于公平感知机器学习中的真实世界数据集，并使用贝叶斯网络分析数据特征之间的关系，进一步进行了探索性分析。

Oct, 2021

机器学习数据集的问责性：源于软件工程和基础设施的实践

通过严格的数据集开发透明度框架，从软件开发生命周期中提取最佳实践，以决策和问责支持来关闭人工智能系统中的问责差距。

Oct, 2020

迈向负责任的人工智能开发生命周期：来自信息安全的启示

提出了一个框架，将信息安全领域和安全开发生命周期的概念应用到人工智能系统的开发中，以解决公正度、可解释性和科技伦理等方面的问题。

Mar, 2022

机器学习中隐私和公平性的整体调查

隐私和公正是负责任的人工智能和可信机器学习的两个关键支柱。本文对隐私和公正在机器学习中的影响进行了综述，包括有监督学习、无监督学习、半监督学习和强化学习，并提出了同时实现这两个目标时所面临的研究挑战，特别关注大规模语言模型。

Jul, 2023

社会责任型人工智能算法：问题、目标和挑战

本文介绍了开发 Socially Responsible AI Algorithms 框架的意义和方法来实现人工智能的可信赖，从而提高人类社会的福祉。

Jan, 2021

困境工具包：去偏见和公平公式以实现负责任的 AI/ML

本文探讨公平和道德人工智能的方法，引入了一组三部分的决策工具包，涉及公正 AI / ML 的相关问题，并主张采用特定的推理和创造性的方法去解决负责任的算法 / 数据驱动系统面临的各种问题。

Mar, 2023

可信分布式 AI 系统：鲁棒性、隐私和治理

新兴分布式人工智能系统通过稳健性保证、隐私保护和公平意识在分布式学习中改善了安全、隐私和公平的问题。本文提供了分布式学习的不同架构概述、围绕对抗攻击、隐私保护和公平治理的对策分类，并讨论了面临的挑战和未来研究方向。

Feb, 2024

探索科学研究的负责任人工智能：一项实证研究

本文研究了科学研究机构在负责人工智能设计和开发中的道德风险意识和准备情况，揭示了知识缺口和对可用人工智能伦理框架的意识有限。我们的研究结果显示，在没有适当的指导和管理下实施人工智能技术可能会带来潜在的道德风险，因此需要全面的策略来提高团队能力，支持负责、道德和包容的人工智能开发和部署。

Dec, 2023

AI 竞赛与基准测试：数据集开发

发展机器学习数据集的方法论和实践经验，涵盖数据准备、集合、质量评估等方面。

Apr, 2024