关键词open-vocabulary panoptic segmentation
搜索结果 - 2
- PosSAM: 全景开放词汇片段检测
提出了一种开放词汇的全景分割模型,通过端到端框架有机地结合了 Segment Anything Model (SAM) 和视觉 - 语言 CLIP 模型的优势。通过使用局部判别汇聚模块(LDP),克服了 SAM 的局限性,并引入了面向掩膜的 - 视觉语言特征场景
我们提出了一种新的算法,Panoptic Vision-Language Feature Fields (PVLFF),可以同时进行语义和实例分割,通过对输入帧上的 2D 实例分割提案应用对比损失函数来联合学习视觉 - 语言特征和分层实例特