Jan, 2019

深度 Q 学习的理论分析

TL;DR本论文从算法和统计角度出发,对深度强化学习中的深度Q网络算法进行了理论分析,并给出了收敛速率。作者还提出了Minimax-DQN算法,并将其与马尔可夫博弈的Nash均衡进行收敛速率的比较。