Jun, 2021

探索内在归纳偏差的视觉变换器高级版

TL;DR论文提出了一种新的具有局部偏好和尺度不变性的图像模型 ——ViTAE,其利用多个卷积模块降采样并将输入图像嵌入到多尺度上下文具有丰富的令牌中,从而学习到具有鲁棒性的对象特征表示。