open-vocabulary image segmentation aims to partition an image into semantic
regions according to arbitrary text descriptions. However, complex visual
scenes can be naturally decomposed into simpler parts and abstracted at
multiple levels of granularity, introducing inherent segmentatio
提出了一种全方位理解 3D 场景的通用 3D 分割方法 OmniSeg3D,通过层次对比学习框架将多视图不一致的 2D 分割提升为一致的 3D 特征场,实现了分层分割、多对象选择和全局离散化,并通过大量实验验证了该方法在高质量 3D 分割和准确定义了层次结构方面的有效性,进一步利用图形用户界面实现了灵活的全方位 3D 分割的交互操作。