Mar, 2024

对比区域指导:在无需训练的视觉语言模型中改善定位

TL;DR通过对视觉线索进行引导,使用对比区域引导(CRG)方法可以提高视觉 - 语言模型(VLMs)在多种视觉 - 语言任务上的性能,减少模型偏见,提高准确性。