Feb, 2024

通用的语义视觉查询生成对于零样本全景和语义分割

TL;DR为了更好地推广到看不见的类别,我们提出了条件令牌对齐和循环转换 (CONCAT),以生成具有普适性的语义视觉查询,经过实验,在零样本全景分割 (ZPS) 上取得了 5.2% 的 hPQ 提高,并在测试中比 SOTA 快 2 倍。