Jul, 2023

Polybot:在接纳变异性的同时,为多个机器人训练一个策略

TL;DR通过重新使用大型数据集,提出在多个机器人平台上训练单一策略的关键设计决策,通过对视觉和动作空间的对齐以及对内部表示的对齐来解决机器人平台之间的领域差异,验证了该方法在不同机器人上收集的新任务数据中成功率和样本效率的显著提升。