IJCAIMay, 2015

不确定环境下的规划元推理

TL;DR提出了一种基于 metareasoning 的在线规划模型,用于解决实际场景下规划时间成本与策略改进的平衡问题,并通过引入 BRTDP 规划算法的特殊性质,提出了近似的元推理过程。