BriefGPT.xyz
Aug, 2024
为开放词汇语义分割辩护的懒惰视觉定位
In Defense of Lazy Visual Grounding for Open-Vocabulary Semantic Segmentation
HTML
PDF
Dahyun Kang, Minsu Cho
TL;DR
本文提出了一种懒惰视觉定位的两阶段方法,通过无监督对象掩膜发现和后续的对象定位,解决开放词汇语义分割的问题。该方法无需额外训练,在多个公共数据集上表现优异,显示出模型在精确定位对象方面的能力。
Abstract
We present
Lazy Visual Grounding
, a two-stage approach of unsupervised
Object Mask Discovery
followed by object grounding, for
Open-Vocabulary
→