BriefGPT.xyz
Ask
alpha
关键词
state-only demonstrations
搜索结果 - 2
通过最小化逆动力学不一致性从观察中进行模仿学习
本文研究了利用只有状态的演示进行模仿学习的观察学习(LfO)。通过理论和实践的角度,我们首先证明了如果遵循 GAIL 的建模方法,LfD 和 LfO 之间的差距实际上在于模仿者和专家之间的逆动力学模型的分歧。我们提出了 Inverse-Dy
→
PDF
5 years ago
基于观察数据的生成对抗模仿
本文提出了一种基于生成对抗网络的从观察中模仿学习方法(GAIfO),它可以在没有行动信息的情况下直接从状态演示中学习,进行了两种不同设置的实验证明它在高维模拟环境中优于现有的直接从状态演示方法。
PDF
6 years ago
Prev
Next