Jun, 2023

唤醒视觉 Transformer 中的平移等变性

TL;DR本文提出了一种自适应的多相位锚定算法,该算法可无缝集成到视觉 Transformer 模型中,以确保贴片嵌入和子采样关注模块的移位等变,并利用深度卷积编码位置信息。