AAAIFeb, 2019

因果决策问题的指导原则

TL;DR本文提出基于 Causal Graphical Model 的 Causal Decision Problem 的求解方法,并结合 Pearl 的 Do-Calculus 及 Expected Utility 原理,提出一种在线决策制定程序,可学习环境因果模型,并展示与经典强化学习算法具有类似的性能。因此,本文旨在提供基于因果信息的决策制定程序的优化保证。