ICLRApr, 2020

运动中的思考:深度强化学习与并发控制

TL;DR本文研究了强化学习在控制系统中的并发控制问题,提出了一种基于连续时间贝尔曼方程的离散化方法,结合深度强化学习算法实现了一个新的近似动态规划方法,并在仿真和实际机器人抓取任务中进行了验证。