Dec, 2023

OpenSight:一种基于 LiDAR 的目标检测简单开放型词汇框架

TL;DR提出了基于 LiDAR 的开放词汇检测的先进 2D-3D 建模框架 OpenSight,通过生成 2D 边框并将其与 LiDAR 点云转换为对应的 3D 边框,增强了通用对象感知能力,并通过交叉模态对齐和融合进行特定语义解码,从而在广泛应用的 3D 检测基准上建立了最先进的开放词汇性能,并有效识别感兴趣的新类别对象。