Jan, 2021

推荐系统中的长期公平性

TL;DR本文提出了一种用于动态公平学习的约束强化学习算法,通过将推荐问题建模为约束马尔可夫决策过程,以解决推荐系统中长期公平性的问题。实验结果表明,该算法在推荐性能、短期公平性和长期公平性方面均具有优越性。