Feb, 2024

实践造就完美:学习技能参数策略的规划

TL;DR机器人通过序列化参数化技能来有效决策复杂的、长期的任务。我们提出了一种自主学习方法,通过评估每个技能的能力预测在任务中的能力,并通过能力感知规划将技能应用于任务分布。通过在仿真和现实世界中的实验,我们发现这种方法比其他基线方法能更加高效地学习有效的参数策略。