May, 2023

提升细化引用表达分割:超越单图像

TL;DR在更广泛的实际应用场景下,本文提出了一种名为群组式指称表达分割(Group-wise Referring Expression Segmentation,GRES)的更实际、更通用的多模态任务,并引入了一个完整的群组式指称数据集(Grouped Referring Dataset,GRD),该数据集包含由给定表达式描述的目标物体的完整群组式注释。同时,我们还提出了一种基线方法,名为 Grouped Referring Segmenter(GRSer),它明确地捕获语言视觉和群组内视觉 - 视觉交互,实现了 GRES 和相关任务如 Co-Salient Object Detection 和 RES 的最先进结果。