Oct, 2022

对比视觉语言模型中的感知分组

TL;DR本篇论文研究视觉 - 语言模型在理解图像中物体所在区域和组合视觉相关部分方面的表现,提出一种最小的修改方案,获得了先进的无监督分割结果和对冗余相关性的鲁棒性。