Nov, 2023

MARIS: 基于共互关注特征的图像指代分割

TL;DR通过引入互感关注机制来强化交叉模态融合,提出了一种新的参考图像分割方法 MARIS,借助于 Segment Anything Model (SAM),通过两个并行分支,Vision-Guided Attention 和 Language-Guided Attention,双向建模视觉与语言特征之间的关系,并设计了一个 Mask Decoder 来实现明确的语言引导,以达到更一致的分割效果。