Oct, 2023

关于具有 $ε$- 贪心探索的 Deep Q-Networks 的收敛性和样本复杂度分析

TL;DR该论文通过理论分析探讨了深度强化学习中的深度 Q 网络(DQN)和 ε- 贪心探索。论文提供了对实际情况下采用 ε- 贪心策略的 DQN 的首个理论收敛性和样本复杂度分析,并证明了带有递减 ε 的迭代过程能够几何收敛到最优 Q 值函数。实验验证了论文中得出的理论结论对 DQN 的有效性。