Oct, 2024

运动轨迹的少样本学习中的扩散政策组合

TL;DR本研究解决了机器人在学习新技能时所面临的样本效率低下的问题。我们提出了一种新颖的组合方法DSE-扩散分数平衡,通过结合基础政策先验,实现了少样本学习,并利用概率组合扩散政策更好地建模示范数据分布。实验结果表明,该方法在技能学习中,MMD-FK指标平均减少超过30%,并且在现实世界实验中成功教授了机器人新轨迹。