Apr, 2023
弥合示范学习中的动作空间不匹配
Bridging Action Space Mismatch in Learning from Demonstrations
TL;DR使用Morphological Adaptation in Imitation Learning (MAIL)框架,从3D带障碍物情况下,带有两个末端执行器的机器人的演示中训练出一个末端执行器的Franka Panda机器人的可视化控制策略,比Learning from Demonstrations和非Learning from Demonstrations基线方法提高了27%的成功率,并且在面对不同颜色、厚度、大小和材料等多变性的衣物的姿态(旋转和平移)时展现出很好的通用性。