May, 2024

DiffGen: 通过可微分物理仿真、可微分渲染和视觉-语言模型生成机器人演示

TL;DR提出了一种新框架DiffGen,通过集成可微分物理模拟、可微分渲染和视觉-语言模型,实现自动和高效的机器人演示生成,通过最小化语言指令的嵌入与模拟观察结果的嵌入之间的距离来完成指定任务,验证实验表明,DiffGen可以有效地生成机器人数据,并且减少了人力和训练时间的投入。