BriefGPT.xyz
Ask
alpha
关键词
off-policy behavior cloning
搜索结果 - 1
SAFE-GIL:安全引导的模仿学习
SAFE-GIL 通过对专家进行对抗性干扰来引导数据采集,从而解决行为克隆方法的 “错误混合问题”,在安全关键状态下更接近专家行为,并在低数据情况下提高任务成功率和安全性。
PDF
3 months ago
Prev
Next