Apr, 2022

感知、表征、生成:将多模态信息翻译为机器人运动轨迹

TL;DR利用 Perceive-Represent-Generate (PRG) 三阶段框架、多模态深度生成模型,将机器人执行指令的动作序列与不同感知模态(例如视觉或声音)的感知信息相映射,并将其应用于机器人书写任务,完成可读可懂的手写字体。