BriefGPT.xyz
Ask
alpha
关键词
multi-scale vision transformer
搜索结果 - 2
ECCV
Wave-ViT:融合小波和 Transformer 的视觉表示学习
本研究通过构建 Wavelet Vision Transformer 来处理多尺度视觉问题,使用小波变换实现可逆下采样,同时结合局部上下文信息提高自注意力计算结果,结果表明其在图像识别等多种任务上表现优异。
PDF
2 years ago
ResT: 用于视觉识别的高效 Transformer
本文提出了一种高效的多尺度视觉 Transformer 模型,名为 ResT,可作为图像识别的通用骨干。它通过一些优势来应对传统 Transformer 模型在应对分辨率固定的原始图像中存在的缺陷, 特别是建立了一种内存高效的多头自注意力机
→
PDF
3 years ago
Prev
Next