BriefGPT.xyz
Jun, 2024
一个开放词汇的零样本分割的简单框架
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation
HTML
PDF
Thomas Stegmüller, Tim Lebailly, Nikola Dukic, Behzad Bozorgtabar, Jean-Philippe Thiran...
TL;DR
通过使用冻结的仅包含视觉信息的模型和融合离散文本和语言知识的方式,我们提出了SimZSS,一种用于开放性词汇的零样本分割的简单框架。在仅使用图像-标题对数据集进行训练的情况下,我们的方法利用了视觉表示的质量,并在不到15分钟的时间内在8个基准数据集中的7个上实现了最先进的结果。
Abstract
zero-shot classification
capabilities naturally arise in models trained within a
vision-language contrastive framework
. Despite their classification prowess, these models struggle in dense tasks like
→