Jun, 2024

一个开放词汇的零样本分割的简单框架

TL;DR通过使用冻结的仅包含视觉信息的模型和融合离散文本和语言知识的方式,我们提出了SimZSS,一种用于开放性词汇的零样本分割的简单框架。在仅使用图像-标题对数据集进行训练的情况下,我们的方法利用了视觉表示的质量,并在不到15分钟的时间内在8个基准数据集中的7个上实现了最先进的结果。