Jul, 2016

引导策略搜索作为近似镜像下降

TL;DR该论文提出了一种新的指导策略搜索算法,将其解释为镜像下降的近似变体,并提供了改善收敛性的保证。实验结果表明,该算法在机器人导航和操作任务中的表现优于之前的指导策略搜索方法,并且具有更简单的公式和更少的超参数。