Apr, 2024

跨越语言、视觉和行动:多模态VAEs在机器人操作任务中的应用

TL;DR我们关注机器人操作中无监督的视觉-语言-行为映射,探索多模态变分自编码器在无监督机器人操作任务中的应用,并提出一种模型不变训练方法,成功提高模型在模拟环境中的性能,并对个体任务的挑战进行了系统评估,揭示了当前多模态变分自编码器在基于视觉和语言的无监督机器人运动轨迹学习中的潜在优势和限制。