BriefGPT.xyz
Ask
alpha
关键词
adversarial imitation
搜索结果 - 2
ICLR
具有状态的模仿学习与转移动力学不匹配
本文介绍了一种新的基于状态的模仿学习算法,借助最近的对抗模仿学习方法,通过将总体优化目标分解为两个子问题并迭代地解决这些子问题,解决了专家和模仿者 MDPs 之间的过渡动力学不匹配问题。作者还通过 OpenAI Gym 的 MuJoCo 运
→
PDF
4 years ago
任务相关的对抗性模仿学习
本文探讨对抗模仿领域中鉴别器网络学习视觉特征与专家标签之间的虚假关联所造成的关键漏洞,并提出了一种新的解决方案 (TRAIL),该方法通过优化受限的鉴别器来获得 informative rewards。在实验中,我们展示了 TRAIL 能够
→
PDF
5 years ago
Prev
Next