Mar, 2024

M2DA:多模态融合 Transformer 结合驾驶员注意力用于自动驾驶

TL;DR提出了一种多模态融合变压器,结合驾驶员注意力用于自动驾驶,通过 Lidar-Vision-Attention-based Fusion 模块更好地融合多模态数据,并实现不同模态之间更高的对齐,同时结合驾驶员的注意力,赋予自动驾驶车辆类似于人类的场景理解能力,准确识别复杂场景中的关键区域,确保安全。在 CARLA 模拟器上进行实验,以较少的数据在闭环基准测试中取得了最先进的性能。