Apr, 2024

SAFE-GIL:安全引导的模仿学习

TL;DRSAFE-GIL 通过对专家进行对抗性干扰来引导数据采集,从而解决行为克隆方法的 “错误混合问题”,在安全关键状态下更接近专家行为,并在低数据情况下提高任务成功率和安全性。