Apr, 2023

未知动态下的长期公平性

TL;DR本文提出了一种在在线强化学习中形式化长期公平的方法;该方法可以适应不同的控制目标,通过牺牲短期激励来推动分类器 - 人群系统朝着更理想的均衡状态发展,从而在损失和公平违规之间实现同时概率边界的算法。