AAAIMar, 2023

面向语义的动态本地化和细化,用于指代图像分割

TL;DR本论文提出一种基于逐步学习区分性多模态特征的方法,通过不断更新查询作为目标对象的表示,强化与之相关的多模态特征,逐渐从定位中心转为分割中心,实现逐步修复缺失对象部分和 / 或去除多余部分,并在 RefCOCO、RefCOCO+ 和 G-Ref 数据集上的实验结果表明其优于现有方法。