Jan, 2023

字幕出卖:联合字幕对开放性词汇实例分割进行定位和生成

TL;DR本文提出了一种基于Caption Grounding and Generation框架的简单而有效的方法,借助图像标题中的目标名词发现新类别的实例,通过与Mask Transformer基线的结合和caption generation head的生成来提高实例级别开放词汇分割的性能,并在COCO数据集的两个设置下进行了广泛实验,取得了显著的效果。