Aug, 2023

一个重新参数化的视觉变换器(ReVT)用于领域通用的语义分割

TL;DR基于数据增强驱动的方法,使用重新参数化的视觉 Transformer(ReVT)和多模型训练后的权重平均化,实现语义分割的域通用化,在多个基准数据集上实现了 47.3%(之前的技术:46.3%)的小型模型和 50.1%(之前的技术:47.8%)的中型模型的最新 mIoU 性能,同时需要更少的参数,并且帧速率更高,与最佳之前的技术相比,易于实施,而且在推断期间不会增加任何计算复杂度。