Sep, 2023
层次化模仿学习的随机环境
Hierarchical Imitation Learning for Stochastic Environments
Maximilian Igl, Punit Shah, Paul Mougin, Sirish Srinivasan, Tarun Gupta...
TL;DR針對環境的隨機性,本研究提出了 Robust Type Conditioning (RTC) 方法,通過對隨機抽樣的代理類型進行對抗性訓練,實現了分佈的逼真性,並在任務性能上保持或提升了與最先進方法相比的表現。