Aug, 2021

基于线性函数逼近的在线离线证明有效度量对抗学习的生成式模仿学习

TL;DR本文研究了在线和离线线性情况下生成对抗模仿学习,提出了乐观和悲观的生成对抗策略优化算法,并证明了算法的收敛性和误差界。