Jan, 2024

通过强化学习在动态系统中找到公平性的平衡点

TL;DR在这篇论文中,我们研究了在顺序决策中存在着动态系统的公平性问题,提出了一个基于马尔可夫决策过程的算法框架,通过预处理和处理中方法集成各种公平性考虑,平衡传统公平性、长期公平性和效用。