BriefGPT.xyz
Ask
alpha
关键词
gumbel-max structural causal model
搜索结果 - 2
马尔可夫决策过程中的反事实影响
我们的工作解决了马尔可夫决策过程中反事实推断的基本问题,介绍了基于对比反事实和干预分布的影响比较的算法构建反事实模型,并推导出非最优政策以适应观察路径时的影响约束。
PDF
5 months ago
不确定情况下的序列决策中的反事实解释
本文提出了一种基于马尔可夫决策过程和 Gumbel-Max 结构因果模型的动态规划算法寻找决策过程中的反事实解释来优化决策,并在认知行为治疗的合成和真实数据上进行了验证。
PDF
3 years ago
Prev
Next