Dec, 2020

基于Transformer的目标检测

TL;DR本文研究使用纯Transformer模型实现复杂视觉任务中的目标检测,发现Vision Transformer作为骨干网在检测任务上可以产生与传统卷积网络相媲美的结果,而且能够保持更高的图像分辨率。