May, 2024

MaskFuser: 联合多模态符号化的遮罩融合用于端到端自动驾驶

TL;DR提出了一种名为 MaskFuser 的多模态驾驶框架,在统一的语义特征空间中将各种模态标记化,并为进一步行为克隆提供联合表示。通过引入跨模态的掩蔽自编码器训练,增强了融合表示。MaskFuser 在伤害感知输入下提高了驾驶稳定性,并在驾驶得分方面表现优于以往的基线模型。