Dec, 2023

CLIP 作为 RNN:无需培训即可分割无限的视觉概念

TL;DR通过引入一个创新的递归框架,我们的研究表明,在不进行训练的情况下,我们的模型能够优于那些经过百万级附加样本微调的方法,为零样本语义和参考图像分割任务的最新记录设定了新的技术水平。