Sep, 2023

FusionFormer:鸟瞰视图和时间一致 Transformer 的多感知融合用于 3D 目标

TL;DR多传感器模态融合的 FusionFormer 框架通过 transformers 混合多模态特征,获取鸟瞰图特征,并通过可灵活适应输入模态表示的深度预测分支提高相机检测任务的性能,同时提出一种基于 transformers 的即插即用的时域融合模块用于融合历史帧鸟瞰图特征,实现更稳定可靠的检测结果,通过对 nuScenes 数据集的评估,其在 3D 目标检测任务中获得了 72.6%的 mAP 和 75.1%的 NDS,优于现有的最先进方法。