Nov, 2023

视觉语言模型中无需标签的开放词汇语义分割的即插即用稠密提取

TL;DR通过大规模视觉-语言模型,我们提出了一种简单但非常有效的无需训练的技术,Plug-and-Play开放词汇语义分割(PnP-OVSS),并通过Salience Dropout技术实现了与现有技术相比的显着改善。