BriefGPT.xyz
Jul, 2023
Polybot:在接纳变异性的同时,为多个机器人训练一个策略
Polybot: Training One Policy Across Robots While Embracing Variability
HTML
PDF
Jonathan Yang, Dorsa Sadigh, Chelsea Finn
TL;DR
通过重新使用大型数据集,提出在多个机器人平台上训练单一策略的关键设计决策,通过对视觉和动作空间的对齐以及对内部表示的对齐来解决机器人平台之间的领域差异,验证了该方法在不同机器人上收集的新任务数据中成功率和样本效率的显著提升。
Abstract
reusing large datasets
is crucial to scale
vision-based robotic manipulators
to everyday scenarios due to the high cost of collecting robotic datasets. However, robotic platforms possess varying control schemes,
→