ECCVDec, 2021

一个简单的单尺度视觉 Transformer 用于物体定位和实例分割

TL;DR本文提出了一种简单的视觉 Transformer 设计,作为目标定位和实例分割任务的强大基线,绕过传统设计思路,通过 UViT 架构实现更好的计算成本和多尺度全局上下文聚合的平衡。