Dec, 2022

CoupAlign:耦合词素和像素的句子掩码对称,用于图像指代分割

TL;DR提出了一种名为 CoupAlign 的多级视觉语义对齐方法,通过单词 - 像素对齐和句子 - 掩码对齐相结合的方式实现了对像素的更准确的定位和分割,可以在 RefCOCO 和 G-Ref 数据集上对同类多个对象进行分辨。