Nov, 2023

泛影:面向自动驾驶的全景和可控视频生成

TL;DR本文介绍了 Panacea,一种创新方法,用于在驾驶场景中生成全景和可控的视频,生成无限多样化的、关键的自动驾驶样本,从而提高自动驾驶技术的先进性。Panacea 通过整合一种新颖的 4D 注意力和两阶段的生成流程来保持一致性,并利用 Bird's-Eye-View(BEV)布局的 ControlNet 框架实现精确控制。对 Panacea 在 nuScenes 数据集上进行的广泛定性和定量评估证明了其在生成高质量多视角驾驶场景视频方面的有效性。该工作通过有效增加用于高级 BEV 感知技术的训练数据集,显著推动了自动驾驶领域的发展。