关键词long-horizon robotic tasks
搜索结果 - 2
- 技能变换器:移动操纵的一体化策略
通过结合条件序列建模和技能模块化,我们提出了 Skill Transformer 方法,用于解决长期规划的机器人任务,并通过 Transformer 架构和演示轨迹对高级技能和低级动作进行端到端训练,并通过技能预测模块保持整体任务的组合性和 - 中继策略学习:通过模仿和强化学习解决长时间间隔任务
本文提出了一种中继策略学习的方法,可用于模仿和强化学习,旨在解决多阶段、长视程机器人任务,包括模仿学习阶段和强化学习阶段,通过学习目标条件分层策略和使用新颖的数据重新标记算法简化了政策学习问题,并证明了该方法在挑战性的厨房模拟环境中解决多阶