BriefGPT.xyz
Ask
alpha
关键词
sequential bias
搜索结果 - 1
从单个演示中利用连续性进行强化学习
该研究使用深度强化学习通过单个演示来学习控制复杂机器人任务的目标条件策略,并提出 DCIL-II 算法以解决连续目标之间的兼容性问题,并在仿真环境中展示了前所未有的样本效率。
PDF
2 years ago
Prev
Next