Jan, 2023

字幕出卖:联合字幕对开放性词汇实例分割进行定位和生成

TL;DR本文提出了一种基于 Caption Grounding and Generation 框架的简单而有效的方法,借助图像标题中的目标名词发现新类别的实例,通过与 Mask Transformer 基线的结合和 caption generation head 的生成来提高实例级别开放词汇分割的性能,并在 COCO 数据集的两个设置下进行了广泛实验,取得了显著的效果。