Apr, 2023

仅需要 Token 即可进行零样本语义分割

TL;DR通过使用预训练的视觉 - 语言模型 CLIP 中的全局标记作为类别先验,建立一个新的模型 ClsCLIP,扩展为零阶段密集预测语义分割方法以及应用本地放大策略进行改进,从而实现与少样本语义分割方法相当的良好性能。