Mar, 2022
使用自然语言命令重塑机器人轨迹: 多模态数据对齐的变压器研究
Reshaping Robot Trajectories Using Natural Language Commands: A Study of
Multi-Modal Data Alignment Using Transformers
TL;DR本文提出了一种基于自然语言的灵活性极高的人机协作接口,将大型语言模型(BERT和CLIP)的优势与轨迹信息相结合,通过多模态注意力变换实现对用户命令的编码,并将其与轨迹信息相结合。在包含机器人轨迹的数据集上进行模仿学习,并将轨迹生成过程视为序列预测问题,通过仿真轨迹实验和真实机器人实验验证了该系统的效果优异,并证明了自然语言接口在人机协作中的优越性。