Jul, 2023

领域通用城市场景分割的学习增强掩模变换器

TL;DR本文提出了一种基于 Content-enhanced Mask TransFormer (CMFormer) 的 Transformer 分割模型,该模型通过将图像内容信息和其下采样版本的图像特征融合到一个多分辨率内容增强的蒙版注意力学习方案中,从而在各种领域通用的城市场景语义分割数据集上显着优于现有的基于 CNN 的方法。