正向强化学习的序列多智能体选择中的长期公平性

Jul, 2024

正向强化学习的序列多智能体选择中的长期公平性

Long-Term Fairness in Sequential Multi-Agent Selection with Positive Reinforcement

Bhagyashree Puranik, Ozgur Guldogan, Upamanyu Madhow, Ramtin Pedarsani

TL;DR研究了在多个代理人从共同申请人池中选择的情况下，多代理人公平贪心策略的 long-term fairness 目标集收敛性，并通过合成和适应现实世界数据集提供了实证证据，同时指出在更复杂的申请人池演化模型中，若代理人不协调行动可能会导致负反馈，降低少数群体的申请人比例。

Abstract

While much of the rapidly growing literature on fair decision-making focuses on metrics for one-shot decisions, recent work has raised the intriguing possibility of designing sequential decision-making to positiv

发现论文，激发创造

从公平决策到社会平等

本文研究了在智能决策系统中公平性的一个重大问题，即如何在决策过程中考虑人口的长期影响。我们提出了一个简单却深入的模型，它将考虑到人员选择以及政策对群体资格的影响力，重点研究肯定行动的形式主义。我们的研究明确了这个制约政策对于旨在实现平衡的肯定行动而言的成果，它是对智能决策系统中不断变化着的影响因素与公平性之间关系的重要探究。

Dec, 2018

算法决策政策的长期影响：通过社会学习的努力不公和特征隔离

该研究提出了一种算法公平的努力程度量度标准，并提出了一种数据驱动框架，用于表征算法政策对重塑基础人口的长期影响。

Mar, 2019

多阶段选择中本地公平的代价

该论文研究了在多阶段决策中，如何定义并保证公平性问题，提出了局部公平和全局公平的概念，并通过线性规划计算最大化精度的局部公平和全局公平选择。此外，还定义了局部公平的代价来衡量因遵循局部公平而导致的精度损失。

Jun, 2019

如何公正决策长期资格问题？

本文针对决策公平性方面的长期影响进行研究，研究人员通过模拟静态公平约束下群体福祉的平等和改进的长期影响以及潜在的干预措施，发现其对于群体福利可同时具有促进平等和增加差距两种影响，同时提出一种理论框架并完成了基于实际数据与模拟动态的社会科学研究。

Oct, 2020

意外选择：持续资格率不平等和干预措施

本文探讨无偏见的机器学习模型，使用代理验证了一组因初等条件差异而存在的人群之间的资格率不平等的现象，并考虑了公平干预措施及反馈控制机制对解决这种不平等现象的作用。

Nov, 2021

未知动态下的长期公平性

本文提出了一种在在线强化学习中形式化长期公平的方法；该方法可以适应不同的控制目标，通过牺牲短期激励来推动分类器-人群系统朝着更理想的均衡状态发展，从而在损失和公平违规之间实现同时概率边界的算法。

Apr, 2023

设计动态系统中的长期群体公平策略

在这篇论文中，我们提出了一个新的框架，用于在动态系统中实现长期群体公平性，即使在政策设计过程中已经考虑了公平性。我们通过使用时间齐次马尔可夫链对系统动态进行建模，并利用马尔可夫链收敛定理优化政策，确保独特的收敛性。我们给出了一些系统的不同目标公平状态的示例，并展示了我们的方法如何在长期和收敛之前评估不同目标对群体条件人口分布的影响和演化。

Nov, 2023

记得公平：关于序列决策中的非马尔可夫公平（初步报告）

非马尔科夫公平关系在顺序决策制定中起着重要作用，研究涉及多方利益相关者和附加约束条件的决策制定过程中的公平性问题。

Dec, 2023

从观测数据中学习多阶段选择问题的公平策略

通过解决难以计算的无限机会约束程序，提出了一种多阶段框架，用于从观测数据中学习公平策略，该问题与公司招聘、贷款批准或保释决策等高风险领域中的选择相关，我们专注于可解释的线性选择规则，并通过解决混合二次锥优化问题获得了组合评价的解决方案，与现有的选择策略相比，在精确度方面提高了11.6%，在不公平度方面减少了38%。

Dec, 2023

不公平背后的原因：探索强化学习中的公正动态

通过因果关系的分析，我们探讨了强化学习问题中不公平性产生的根源，并提出一种明确捕捉环境动态引发的不公平性的新概念，以解释、检测和减少强化学习中的不平等。

Apr, 2024