AAAIDec, 2023

马尔科夫决策过程中的委托 - 代理奖励塑造

TL;DR两个参与方之间的代理问题会给利益产生冲突。本文探讨了奖励设计在预算限制下如何提高委托方效用,研究了一个两人博弈模型中的马尔科夫决策过程,结果表明该问题的求解是 NP 难的,但我们提供了针对随机树和具有有限时间跨度的确定性决策过程的多项式逼近算法。