Sep, 2024

RenderWorld:自监督3D标签的世界模型

TL;DR本文针对视觉驱动的端到端自动驾驶系统中存在的成本和可靠性问题,提出了一种新颖的RenderWorld框架,通过自监督的高斯基础Img2Occ模块生成3D占用标签,并采用AM-VAE进行编码。研究发现,RenderWorld在4D占用预测和运动规划方面实现了最先进的性能,显著提高了分割精度并减少了GPU内存消耗。