Jul, 2021

不确定情况下的序列决策中的反事实解释

TL;DR本文提出了一种基于马尔可夫决策过程和 Gumbel-Max 结构因果模型的动态规划算法寻找决策过程中的反事实解释来优化决策,并在认知行为治疗的合成和真实数据上进行了验证。