Oct, 2023

简洁高性能的纯视觉变换语义分割

TL;DR通过对简单的 Vision Transformer(ViT)模型进行高性能的分割实验,本文提出了 PlainSeg 和 PlainSeg-Hier 两种简洁高效的模型,包括了最后一个特征图的 3x3 卷积和 Transformer 编码器或解码器,并结合了高分辨率特征和更大的学习率,实验证明这些模型在语义分割中具有高性能和高效率,是评估基础模型转移能力的有力工具。