ICMLJun, 2024

单回路(自然) Actor-Critic 与兼容的函数逼近的非渐近分析

TL;DR该研究提供了 Actor-Critic(AC)算法和 Natural Actor-Critic(NAC)算法的最紧密的非渐近收敛界限,并使用兼容函数逼近进行收敛性分析。