关键词continuous control domains
搜索结果 - 2
- ICLR跨领域最优输运模仿学习
本研究提出了一种基于 Gromov-Wasserstein 距离的 “GWIL” 方法,用于跨领域模仿学习,其理论模型明确了 GWIL 保持最优性的场景和实现方式,实验结果表明 GWIL 对于连续控制域中各种变换的效果良好。
- 数据高效的灵巧操作深度强化学习
本研究使用深度学习和强化学习方法解决机器人的熟练操作任务,同样使用了 DDPG 算法来扩展其功能以实现更高效的数据利用与可伸缩性,成功地使用现实世界的抓取和叠放机器人的交互数据训练出其掌握复杂熟练操作技能的有效策略模型。