Jun, 2024

用高密度视觉粒子动力学模拟现实世界

TL;DR通过处理包含 10 万 + 粒子的大规模潜在点云,我们提出了一个学习的世界模型 —— 高密度视觉粒子动力学(HD-VPD),它可以模拟真实场景的物理动力学。为了在这一规模上实现高效率,我们引入了一种新颖的点云变换器(PCTs)家族,称为 Interlacer,利用交织的线性注意力 Performer 层和基于图的邻居注意力层。相比之前的图神经网络方法,我们的 Interlacer 动力学速度是原来的两倍,预测质量相同,并且使用 4 倍的粒子可以实现更高的质量。我们展示了 HD-VPD 在建模具有高自由度的双手机器人与两个 RGB-D 相机的动力学方面的能力。我们演示了 HD-VPD 如何通过机器人推箱和抓取任务来评估运动计划的质量。请在此 https URL 上观看通过 HD-VPD 渲染的视频和粒子动力学。