Mar, 2025

时间三平面变换器作为占用世界模型

TL;DR本研究解决了现有世界模型在捕捉智能体运动轨迹与周围环境变化之间的细粒度关联和实时预测能力不足的问题。我们提出了 T$^3$Former,这是一种新型的4D占用世界模型,通过高效压缩3D语义占用环境的三平面表示并提取多尺度时间运动特征,实现了更快的推理速度和更准确的空间规划。实验结果表明,T$^3$Former 的推理速度提升至26帧每秒,平均交并比提升至36.09,绝对规划误差降低至1.0米。