Dec, 2021

一个简单的单尺度视觉Transformer用于物体定位和实例分割

TL;DR本文提出了一种简单的视觉Transformer设计,作为目标定位和实例分割任务的强大基线,绕过传统设计思路,通过UViT架构实现更好的计算成本和多尺度全局上下文聚合的平衡。