MMJul, 2021

DPT: 可变形基于块的 Transformer 用于视觉识别

TL;DR提出了一种新型的 Deformable Patch(DePatch)模块,可以自适应地将图像分割为具有不同位置和比例的补丁,从而更好地保留了补丁中的语义信息。将该模块加入 Transformer 中,在图像分类和目标检测等任务上进行广泛评估。