BriefGPT.xyz
Ask
alpha
关键词
optimistic generative adversarial policy optimization algorithm
搜索结果 - 1
基于线性函数逼近的在线离线证明有效度量对抗学习的生成式模仿学习
本文研究了在线和离线线性情况下生成对抗模仿学习,提出了乐观和悲观的生成对抗策略优化算法,并证明了算法的收敛性和误差界。
PDF
3 years ago
Prev
Next