Jan, 2014

一个适用于单调价值函数的近似动态规划算法

TL;DR提出了一种名为 Monotone-ADP 的算法,利用价值函数的单调性来提高收敛速度,在三个应用领域中展示了数值结果,可以用比计算最优解所需计算量少两个数量级的迭代次数获得高质量解决方案。