Jan, 2023

马尔可夫链浓度不等式及其在强化学习中的应用

TL;DR利用相关的数学工具证明在特定条件下,基于 Martingale Method 的 Lipschitz Function 对于给定的随机变量集合是 subgaussian,同时探讨其在强化学习中的应用。