May, 2023

强化学习的可复制性

TL;DR探讨强化学习领域中复制性的数学研究,提出了基于生成模型下的可复制性 RL 算法,其中包括一个有效的 $ ho$-replicable 算法和一个可计算的近似可复制的算法。