机器学习生命周期中的伤害来源理解框架

Jan, 2019

机器学习生命周期中的伤害来源理解框架

A Framework for Understanding Sources of Harm throughout the Machine Learning Life Cycle

Harini Suresh, John V. Guttag

TL;DR通过提供一个框架，本文阐明了机器学习的七个潜在的后续危害源，并在数据收集、开发和部署等过程中加以控制，以期实现更高效、更准确的沟通。

Abstract

As machine learning (ML) increasingly affects people and society, awareness of its potential unwanted consequences has also grown. To anticipate, prevent, and mitigate undesirable downstream consequences, it is critical that we understand when and how harm might be introduced throughou

machine learning downstream harm ml life cycle data collection deployment

发现论文，激发创造

机器学习系统的风险

提出了一个上下文敏感的机器学习系统风险框架（MLSR），该框架用于识别机器学习系统的一阶和二阶风险，包括应用、设计、控制等，并将伦理 / 人权风险与系统风险结合起来，为机器学习系统进行全面的风险评估铺平了道路。

Apr, 2022

机器学习安全性：网络物理系统、决策科学和数据产品

本论文旨在明确机器学习安全的定义，并通过研究智能决策科学和数据产品等应用领域，探讨实现机器学习安全的四种策略，包括内在安全设计、安全保护垫、安全失败和程序保护，并提出相应的技术方法和异议函数，以确保解释性、因果性、人工参与和用户体验设计等方面的安全性。

Oct, 2016

降低恶意使用合成媒体研究：机器学习的考虑因素和潜在发布实践

本文旨在为机器学习研究的规范和实践提供有益思考工具，特别是集中讨论了如何发布和发布什么样的机器学习 “合成媒体” 研究，以减轻其可能带来的有害影响，提出了一些应对策略和建议，包括加强风险评估，定期参加大会讨论并建立相关机构。

Jul, 2019

语言生成模型可能会造成伤害：那我们能做些什么？一份可执行的调查

本文对语言生成模型潜在威胁与社会危害进行了调查研究，提供了探查与缓解风险和伤害的实用方法，旨在为大型语言模型研究人员和从业者提供实用指南。

Oct, 2022

机器学习研究中的陷阱：重新审视开发周期

本研究从算法设计到数据收集到模型评估的全过程，引起注意常见陷阱，并提供实用建议以改进机器学习，通过案例研究强调这些缺陷在实践中如何发生以及在哪里可以进行改进。

Nov, 2020

机器学习中安全与隐私科学的探索

ML 在安全性方面存在漏洞，提出威胁模型并对攻击进行分类，探究了模型准确性与抗敌对操作的关系。

Nov, 2016

机器学习防御与风险之间的意外相互作用

机器学习模型在安全、隐私和公平性方面不能忽视风险。已有的防御方法虽然可以缓解某些风险，但也可能增加其他风险的易受性。现有研究缺乏一个有效的框架来识别和解释这些意外交互。我们提出了一个这样的框架，基于过度拟合和记忆化的猜想来解释这些意外交互。我们调查了关于意外交互的现有文献，并将其纳入我们的框架。我们使用我们的框架对两种以前未被探索的交互进行了猜想，并通过实验证实了我们的猜想。

Dec, 2023

机器学习研究中的偏见调查

本文通过为潜在的偏见和数据模型中的错误提供分类法，目的是弥合过去关于偏见的文献以及在机器学习中缺少对其根源或原因的研究。调查分析了机器学习（ML）流程中超过四十个潜在的偏见来源，并且为每个来源提供了明确的示例。通过理解机器学习中偏见的来源和后果，可以开发出更好地检测和减轻偏见的方法，从而得到更公正、更透明和更准确的 ML 模型。

Aug, 2023

法律与对抗式机器学习

研究机器学习系统如何应对对抗性操纵时，探讨了计算机犯罪、版权和侵权法与扰动、污染、模型盗窃和模型反演攻击的接口，呼吁机器学习研究人员投资于透明的攻击和防御基准、考虑监管意识下的机器学习系统架构，并在公民自由的背景下更多思考对抗性机器学习问题。

Oct, 2018

确保智能机器行为良好

本文提出了一种新的机器学习算法设计框架，通过此框架可以简化机器学习算法不良行为的规定和规范，并使用该框架创建了一些新的机器学习算法来防止标准机器学习算法展现性别歧视和有害行为。该框架可以确保机器学习算法的安全和负责任应用。

Aug, 2017