关键词inverse dynamics model
搜索结果 - 6
- ICML掩码轨迹模型:预测、表征和控制
本文介绍了遮盖轨迹模型 (MTM) 作为顺序决策制定的一般抽象。MTM 采取轨迹,如状态动作序列,并旨在在相同轨迹的随机子集的条件下重建轨迹。通过高度随机化的遮盖模式进行训练,MTM 学习多功能网络,可以通过在推理时选择适当的遮罩来扮演不同 - 半监督离线强化学习与无动作轨迹
通过开发新的算法流程,利用多种数据来源进行线下强化学习,仅使用 10%的数据可以达到与完全有标签的数据集相似的性能,同时进行大规模控制实验,以确定半监督学习应用于 RL 的最佳实践。
- 通过椭圆周期性奖励进行探索
研究了强化学习(RL)方法在探索复杂环境时的有效性,并引入通过椭圆形周期性奖励探索方法(E3B)以扩展计数周期性奖励至连续状态空间,使用反向动力学模型学习嵌入以捕获环境可控方面,可扩展到高维像素感知和现实环境中。在挑战任务中实现了全新的 s - 精细操作的纯状态模仿学习
研究了在复杂领域中,采用反向动力学模型辅助的状态模仿学习方法,并将其与传统的专家演示方法相比,证明了该方法在不同动力学、形态、物体的模拟学习中表现出了良好的优越性能。
- 结合自监督学习和模仿技巧实现基于视觉的绳索操作
这篇论文提出了一种基于学习的系统,通过自监督学习从图像中学习绳索操纵的像素级逆动力学模型,并使用高低级计划成功地模仿人类示范,将可变形物体如绳索和布料进行操纵。
- 通过学习深度反向动力学模型,从模拟环境实现向真实世界的迁移
本文研究了如何将在模拟中成功的控制策略推广到实际机器人上,通过计算模拟根据该策略期望的状态并利用深度逆动力学模型决定哪种真实世界的控制动作最适合实现这些状态,同时提出了一种数据收集方法(逐步)学习深度逆动力学模型。