May, 2024

Vista:一个具有高度真实和多功能可控性的通用驾驶世界模型

TL;DR通过系统诊断现有方法的不足,我们提出了具有高保真度和灵活可控性的可扩展驾驶世界模型 Vista,利用新的损失函数促进移动实例和结构信息的学习,并通过有效的潜在替代方法注入历史帧作为前提进行连贯的长程预测。此外,我们利用 Vista 本身的能力首次建立了一种对真实世界动作评估的通用奖励。