Dec, 2023

深度强化学习邀请

TL;DR通过将强化学习视为监督学习的一种推广,本文介绍了一个与经典强化学习教材不同的方法,使读者在了解基本的监督学习知识后能够理解类似于近端策略优化(PPO)的最新深度强化学习算法。