Aug, 2023

EAVL:明确对齐视觉与语言以实现图像引用分割

TL;DR通过显式对齐视觉和语言特征,我们提出了针对指代图像分割的显式对齐视觉和语言的方法(EAVL),该方法通过生成多个查询并将其转换为一系列基于查询的卷积核,在分割阶段对齐语言和视觉特征,以实现与语言相关的定位,并在 RefCOCO,RefCOCO + 和 G-Ref 上超过了之前最先进的方法。