Apr, 2024

标定与重建:用于指代图像分割的深度集成语言

TL;DR利用 CRFormer 模型,通过连续校准多模态特征,引入语言重建模块和重建损失,解决自然语言表达的图像分割问题,并在多个数据集上表现优于现有方法。