Dec, 2018

深度强化学习与致命三角

TL;DR研究死亡三元组对于经验回放训练的深度 Q 网络模型的影响,分析该系统的组件在死亡三元组的出现和代理的表现中的作用。