Sep, 2018

Vulcan:用于大量几率受限 MDP 的蒙特卡罗算法,带有风险边界函数

TL;DR本文提出了一种基于约束和蒙特卡罗树搜索的方法Vulcan,用于解决在可能存在危险结果或未知环境情况下的决策问题,并在计算效率和结果优化度等方面取得了较好的结果。