Apr, 2023

强化学习教程介绍

TL;DR本文介绍了强化学习的概念,重点讲述了随机逼近在其中的作用。文中涵盖了马尔可夫奖励过程、马尔可夫决策过程、随机逼近算法以及广泛使用的算法如时序差分学习和 Q 学习。