ECCVJul, 2022

Wave-ViT:融合小波和 Transformer 的视觉表示学习

TL;DR本研究通过构建 Wavelet Vision Transformer 来处理多尺度视觉问题,使用小波变换实现可逆下采样,同时结合局部上下文信息提高自注意力计算结果,结果表明其在图像识别等多种任务上表现优异。