NIPSDec, 2016

端到端深度强化学习实现车道保持辅助

TL;DR本文提出了不同的深度强化学习方法用于自动驾驶,分别包括离散行动类别中的深度 Q 网络算法 (DQN) 和连续行动类别中的深度确定性演员 - 评论家算法 (DDAC),并在 TORCS 模拟器中测试了其性能。