ICMLFeb, 2018

Actor-Critic 方法中的函数逼近误差处理

TL;DR该研究提出了一种基于 Double Q-learning 的算法来处理深度 Q-learning 和 actor-critic 算法中出现的过高估计的问题,在 OpenAI Gym 的测试中,该算法表现出优异的性能。