Jan, 2023

从自然语言监督中学习开放词汇语义分割模型

TL;DR本文提出一种基于Transformer的模型用于开放词汇语义分割(Open-Vocabulary Semantic Segmentation, OVS),该模型通过使用网络爬虫图像-文本对进行预训练,并提出了两种代理任务和数据集以提高训练效率和分割结果。在三个基准数据集上实现了优异的零-shot迁移效果。