Apr, 2024

扮演他人角色中的扩散:利用扩散进行机器人的视角理解

TL;DR在人形机器人中,我们引入了一种新的传播模型,该模型旨在使机器人直接从第三人称演示中学习。我们的模型能够通过转换两个视角之间的物体大小和旋转以及环境来学习和生成第一人称视角,从而充分利用易于产生的第三人称演示和易于模仿的第一人称演示的优势。该模型可以表示第一人称视角的 RGB 图像或计算关节值。在这项任务中,我们的方法明显优于其他图像到图像模型。