May, 2024

开放词汇SAM3D:理解任何三维场景

TL;DROV-SAM3D是一个通用框架,用于不需要训练即可理解任何3D场景的开放词汇三维场景理解,通过使用Segment Anything Model (SAM)生成超点并通过Recognize Anything Model (RAM)的开放标签和操作表,结合超点和分割掩模生成最终的3D实例,经过对ScanNet200和nuScenes数据集的实证评估,我们的方法在未知的开放世界环境中超越了现有的开放词汇方法。