ICLRApr, 2020
运动中的思考:深度强化学习与并发控制
Thinking While Moving: Deep Reinforcement Learning with Concurrent Control
Ted Xiao, Eric Jang, Dmitry Kalashnikov, Sergey Levine, Julian Ibarz...
TL;DR本文研究了强化学习在控制系统中的并发控制问题,提出了一种基于连续时间贝尔曼方程的离散化方法,结合深度强化学习算法实现了一个新的近似动态规划方法,并在仿真和实际机器人抓取任务中进行了验证。