平等的长期收益率：将静态公平概念应用于顺序决策

Sep, 2023

平等的长期收益率：将静态公平概念应用于顺序决策

Equal Long-term Benefit Rate: Adapting Static Fairness Notions to Sequential Decision Making

Yuancheng Xu, Chenghao Deng, Yanchao Sun, Ruijie Zheng, Xiyao Wang...

TL;DR通过引入一种名为 ELBERT-PO 的偏差缓解方法，我们在三个连续决策环境上的实验证明 ELBERT-PO 方法显著减少了偏差并保持了高效用性。

Abstract

Decisions made by machine learning models may have lasting impacts over time, making long-term fairness a crucial consideration. It has been shown that when ignoring the long-term effect, naively imposing fairness criterion in static settings can actually exacerbate bias over time. To

long-term fairness sequential decision-making bias mitigation elbert-po policy gradient

发现论文，激发创造

决策系统长期公平性的优势正则化策略优化

本文介绍了使用深度强化学习方法来优化决策的长期公平性，通过比较三个案例，结果表明，我们的方法可以通过正则化不同动作的优势评估来轻松实现公平性约束而不需要奖励工程或牺牲训练效率。

Oct, 2022

实现序列决策中的长期公平性

本文提出了一种框架，以实现长期公平的顺序决策制定。通过进行强制性和软性干预，我们提出了将路径特定效应作为测量长期公平性的定量工具的方法。公平的顺序决策制定问题被规定为一个以效用为目标、长期和短期公平性为约束条件的约束优化问题。我们展示了这样一个优化问题可以被转化为一个执行风险优化。最后，使用了重复风险最小化（RRM）进行模型训练，并在理论上分析了 RRM 的收敛性。经验证实，该算法在合成和半合成的时间数据集上表现良好。

Apr, 2022

基于深度生成模型的长期公平决策

研究论文通过使用时间因果图和不同人群干预分布之间的 1-Wasserstein 距离作为定量指标，以减少顺序决策系统中的群体差异，研究了长期公平的机器学习。然后，提出了一个三阶段的学习框架，其中决策模型在深度生成模型生成的高保真数据上进行训练，将优化问题制定为执行风险最小化，并采用了重复梯度下降算法进行学习。经验评估证明了所提出方法在合成和半合成数据集上的有效性。

Jan, 2024

未知动态下的长期公平性

本文提出了一种在在线强化学习中形式化长期公平的方法；该方法可以适应不同的控制目标，通过牺牲短期激励来推动分类器 - 人群系统朝着更理想的均衡状态发展，从而在损失和公平违规之间实现同时概率边界的算法。

Apr, 2023

实时决策的长期公平性：一种受限在线优化方法

通过引入一个名为 LoTFair 的在线算法，本研究提出了一个框架，用于在具有时间变化公平性约束的动态决策系统中确保长期公平性。研究证明，LoTFair 可以在保持长期性能的同时，使整体公平性违规变得微不足道。

Jan, 2024

执行延迟影响公平性保证

本研究介绍了 ELF 分类算法，通过考虑决策在人们的生活和福祉中所产生的长期影响，提供高可信的公平性保证，并证明了 ELF 返回不公平解决方案的概率小于用户指定的公差。同时我们的实验表明该算法能够成功地缓解长期的不公平现象。

Aug, 2022

如何公正决策长期资格问题？

本文针对决策公平性方面的长期影响进行研究，研究人员通过模拟静态公平约束下群体福祉的平等和改进的长期影响以及潜在的干预措施，发现其对于群体福利可同时具有促进平等和增加差距两种影响，同时提出一种理论框架并完成了基于实际数据与模拟动态的社会科学研究。

Oct, 2020

公平机器学习的延迟影响

本研究研究了在机器学习中关于公平性的概念，发现公平标准在不同的时间指标下可能会对个体产生不同的影响，同时量化误差也会影响其效果评估。

Mar, 2018

通过强化学习在动态系统中找到公平性的平衡点

在这篇论文中，我们研究了在顺序决策中存在着动态系统的公平性问题，提出了一个基于马尔可夫决策过程的算法框架，通过预处理和处理中方法集成各种公平性考虑，平衡传统公平性、长期公平性和效用。

Jan, 2024

设计动态系统中的长期群体公平策略

在这篇论文中，我们提出了一个新的框架，用于在动态系统中实现长期群体公平性，即使在政策设计过程中已经考虑了公平性。我们通过使用时间齐次马尔可夫链对系统动态进行建模，并利用马尔可夫链收敛定理优化政策，确保独特的收敛性。我们给出了一些系统的不同目标公平状态的示例，并展示了我们的方法如何在长期和收敛之前评估不同目标对群体条件人口分布的影响和演化。

Nov, 2023