Sep, 2019

不确定性下的风险规避规划

TL;DR本文提出基于有限状态控制器的有界策略迭代方法,通过标准的凸优化算法设计出完全风险规避的 POMDP 最优策略,并针对给定的记忆预算和优化指标对控制器进行修改以减小一致风险。