Jul, 2024

当行人检测遇见多模态学习:通用模型和基准数据集

TL;DRMMPedestron是一个新颖的多模态感知通用模型,它能够处理多个传感器模态及其动态组合,并通过引入MAA和MAF实现自适应多模态特征融合。此外,作者还构建了MMPD数据集,其中包含了RGB、IR、Depth、LiDAR和Event等多种传感器模态,通过多模态联合训练,在多个行人检测基准上取得了最先进的性能。