Apr, 2025

统一世界模型:结合视频和动作扩散以在大型机器人数据集上进行预训练

TL;DR本研究解决了大规模机器人基础模型中模仿学习难以扩展的问题,特别是缺乏高质量专家演示的问题。提出的统一世界模型(UWM)框架通过在统一的变换器架构中整合动作扩散和视频扩散过程,从而实现利用视频和动作数据进行策略学习。实验证明,UWM能够有效地进行大规模多任务机器人数据集的预训练,显著提升了政策的通用性与鲁棒性。