Feb, 2021
金字塔视觉变换器:一种适用于无卷积的密集预测的通用主干网络
Pyramid Vision Transformer: A Versatile Backbone for Dense Prediction
without Convolutions
TL;DR本文研究了另一种适用于许多密集预测任务的简单骨架网络,即金字塔视觉Transformer(PVT),它比Transformer具有更高的输出分辨率和更少的计算和内存成本,并且在许多下游任务中提高了性能,例如对象检测,语义和实例分割。