Sep, 2023

层次化模仿学习的随机环境

TL;DR針對環境的隨機性,本研究提出了 Robust Type Conditioning (RTC) 方法,通過對隨機抽樣的代理類型進行對抗性訓練,實現了分佈的逼真性,並在任務性能上保持或提升了與最先進方法相比的表現。