序贯决策中的公平算法

Jan, 2019

Algorithms for Fairness in Sequential Decision Making

Min Wen, Osbert Bastani, Ufuk Topcu

TL;DR本文提出了一种基于 Markov 决策过程的反馈效应建模的方法，通过学习算法来实现公平的决策过程，并通过贷款申请 MDP 的模拟，证明了考虑动态影响的必要性。

Abstract

It has recently been shown that if feedback effects of decisions are ignored, then imposing fairness constraints such as demographic parity or equality of opportunity can actually exacerbate unfairness. We propos

fairness constraints markov decision processes learning algorithms feedback effects dynamical effects

发现论文，激发创造

通过强化学习在动态系统中找到公平性的平衡点

在这篇论文中，我们研究了在顺序决策中存在着动态系统的公平性问题，提出了一个基于马尔可夫决策过程的算法框架，通过预处理和处理中方法集成各种公平性考虑，平衡传统公平性、长期公平性和效用。

Jan, 2024

利用强化学习在多智能体马尔科夫决策过程中实现公平

本文提出了一种基于强化学习和在线凸优化的方法来实现多智能体系统中的公平性，在保证植树的情况下为不同智能体提供公平奖励。该方法能够在未知环境中实现公平，并在实验中得到了验证。

Jun, 2023

算法公平监控

本文介绍了一种基于统计推断的系统的运行时监测技术，该系统具有未知的结构但是被假定为具有马尔可夫链结构。我们引入了一种规范语言，可以模拟许多常见的算法公平性属性，例如人口平均，平等机会和社会负担。使用原型实现，我们展示了如何监测银行在不同社会背景的申请人给予贷款以及学院在保持合理的社会负担的情况下公平地录取学生。

May, 2023

公平性与序贯决策：局限性、教训和机遇

本文比较和讨论了算法公平性和道德决策制定两个主要领域的研究成果，探讨了其规范关切、不同技术方案的可行性，并阐述了两种领域对对方有用的思想。

Jan, 2023

决策系统长期公平性的优势正则化策略优化

本文介绍了使用深度强化学习方法来优化决策的长期公平性，通过比较三个案例，结果表明，我们的方法可以通过正则化不同动作的优势评估来轻松实现公平性约束而不需要奖励工程或牺牲训练效率。

Oct, 2022

基于学习的序列决策算法中的公平性：综述

本文综述了关于数据驱动的序贯决策的公平性的现有文献，重点讨论了两种类型的序贯决策及各种公平性干预措施对基础人口的影响。

Jan, 2020

设计动态系统中的长期群体公平策略

在这篇论文中，我们提出了一个新的框架，用于在动态系统中实现长期群体公平性，即使在政策设计过程中已经考虑了公平性。我们通过使用时间齐次马尔可夫链对系统动态进行建模，并利用马尔可夫链收敛定理优化政策，确保独特的收敛性。我们给出了一些系统的不同目标公平状态的示例，并展示了我们的方法如何在长期和收敛之前评估不同目标对群体条件人口分布的影响和演化。

Nov, 2023

动态系统中的公平因果模型

本文介绍因果有向无环图作为公平性动态系统研究的一个统一框架，阐明了因果假设如何表达和操作，说明了计算干预数量的重要性，并说明了因果假设能够在已知环境动态的情况下进行模拟和在未知动态下进行干预估计，以实现对短期和长期结果的干预，无论是在群体还是个人的层面上。

Sep, 2019

从公平决策到社会平等

本文研究了在智能决策系统中公平性的一个重大问题，即如何在决策过程中考虑人口的长期影响。我们提出了一个简单却深入的模型，它将考虑到人员选择以及政策对群体资格的影响力，重点研究肯定行动的形式主义。我们的研究明确了这个制约政策对于旨在实现平衡的肯定行动而言的成果，它是对智能决策系统中不断变化着的影响因素与公平性之间关系的重要探究。

Dec, 2018

公平徵询的算法框架

介绍了一种框架，在该框架中，可以将成对的个体标识为需要（大约）相等的待遇。我们引入了一种算法，可以在满足预设的公平性约束条件下学习最准确的模型，并证明了其准确性和公平性的泛化界限。该算法还可以将传统的统计公平概念与 elicited constraints 相结合，从而通过前者 “纠正” 或修改后者。我们使用在 COMPAS 犯罪再犯率数据集上 elicited 的 human-subject 公平性约束条件的行为学研究报告了初步结果。

May, 2019