Feb, 2019

深度 Q 学习算法瓶颈的诊断

TL;DR本研究通过实验调查了Q-learning方法在深度强化学习中的潜在问题,并提出了基于神经网络结构的新型采样方法,在高维连续控制领域中获得了显着的改进。