ICLROct, 2021

MobileViT:轻量级、通用、面向移动的视觉 Transformer

TL;DR本文提出了一种 MobileViT 轻量级通用视觉变换器,将 transformers 视为卷积,可用于移动设备,取得了比 CNN 和 ViT 更好的性能,特别是在对象检测任务上。