Jan, 2019

序贯决策中的公平算法

TL;DR本文提出了一种基于 Markov 决策过程的反馈效应建模的方法,通过学习算法来实现公平的决策过程,并通过贷款申请 MDP 的模拟,证明了考虑动态影响的必要性。