ICMLMay, 2024

SAM-E:利用序列模仿与视觉基础模型实现身体操作

TL;DR通过 SAM-E,我们提出了一种新颖的机器人操作体系结构,通过视觉基础模型进行可 generalizable 的场景理解和长期 action 推理的序列模仿,在各种指令跟踪任务中展现出卓越的性能和更高的执行效率,并显著提高了对新任务的少样本适应性。