Aug, 2021
基于线性函数逼近的在线离线证明有效度量对抗学习的生成式模仿学习
Provably Efficient Generative Adversarial Imitation Learning for Online and Offline Setting with Linear Function Approximation
Zhihan Liu, Yufeng Zhang, Zuyue Fu, Zhuoran Yang, Zhaoran Wang
TL;DR本文研究了在线和离线线性情况下生成对抗模仿学习,提出了乐观和悲观的生成对抗策略优化算法,并证明了算法的收敛性和误差界。