CVPRJun, 2024

图像嵌入平衡的开放词汇语义分割

TL;DR提出了一种名为 EBSeg 的开放词汇语义分割框架,利用自适应平衡解码器和语义结构一致性损失来解决模型在训练和新类别之间存在的语义信息差异问题。通过生成不同的图像嵌入表征用于训练和新类别以及优化基于 CLIP 的模型的泛化能力,该方法在各种基准测试中表现出超越其他方法的性能。