Nov, 2023

基于文本和点击输入的明确无歧义开放词汇实例分割

TL;DR我们提出了一种新的分割过程,即文本+点击分割,其中模型接受图像、描述类别的文本短语和指定要分割的实例的单击作为输入,相比以往方法,我们利用开放词汇的图像-文本模型支持广泛的文本提示,通过在文本提示上调节分割结果提高了对于新颖或未见类别的分割准确性。