ICLRMar, 2020

Atari 深度强化学习中数据效率评估需使用适当的基线

TL;DR该研究论文探讨了如何提高深度增强学习的数据效率,并证明了新提出的技术并没有真正提高数据效率,而是增加了复杂性和计算成本,提出了一种新的改进的 DQN 算法,并建议将其作为未来改进深度强化学习数据效率的基准。