CVPRApr, 2022

TopFormer:移动语义分割的 Token 金字塔 Transformer

TL;DR本研究提出了一种名为 TopFormer 的移动友好的架构,该架构以不同尺度的 Token 作为输入,产生具有尺度感知的语义特征,并将这些特征注入到相应的 Token 中以增强表示能力,该方法在多个语义分割数据集上明显优于 CNN 和 ViT 网络,并在 ARM 移动设备上以较低的延迟实现了比 MobileNetV3 更高的平均交并比精度,同时,TopFormer 的微型版本可以在 ARM 移动设备上实现实时推断。