Nov, 2017

利用任务分离和爬山算法进行深度强化学习的自动驾驶车辆

TL;DR本研究文章提出了一种基于模型的强化学习算法,包括任务分离和山峰爬升等策略,用于在自主驾驶中学习深度神经网络参数化控制器,并采用虚拟速度约束与最大稀疏奖励的组合。