Mar, 2025

多任务强化学习中的群体公平性

TL;DR本研究解决了多任务强化学习中确保不同人口群体之间公平结果的关键问题。我们提出了一种新的多任务群体公平性公式,并设计了一种在多个任务上同时显式实施公平约束的优化算法。实验结果表明,该算法能够在维持可比回报的同时,实现更小的公平差距,展示其在现实多任务强化学习应用中的潜力。