ICLRDec, 2022

GPViT:一种高分辨率非分层视觉 Transformer 模型,支持群组传播

TL;DR本文提出的 Group Propagation Vision Transformer 模型是一种新颖的非分层变压器模型,旨在用于高分辨率特征的普适视觉识别,通过 Group Propagation Block 实现效率最大化,该方法在各种视觉识别任务中均取得了显著的性能提升。