Oct, 2023
简洁高性能的纯视觉变换语义分割
Minimalist and High-Performance Semantic Segmentation with Plain Vision
Transformers
TL;DR通过对简单的Vision Transformer(ViT)模型进行高性能的分割实验,本文提出了PlainSeg和PlainSeg-Hier两种简洁高效的模型,包括了最后一个特征图的3x3卷积和Transformer编码器或解码器,并结合了高分辨率特征和更大的学习率,实验证明这些模型在语义分割中具有高性能和高效率,是评估基础模型转移能力的有力工具。