Jan, 2019

深度 Q 学习的理论分析

TL;DR本论文从算法和统计角度出发,对深度强化学习中的深度 Q 网络算法进行了理论分析,并给出了收敛速率。作者还提出了 Minimax-DQN 算法,并将其与马尔可夫博弈的 Nash 均衡进行收敛速率的比较。