BriefGPT.xyz
Ask
alpha
关键词
local positional encoding
搜索结果 - 1
CSWin Transformer: 带有十字形窗口的通用视觉 Transformer 骨干
CSWin Transformer 是一种有效的基于 Transformer 网络的视觉任务骨干,并通过使用 Cross-Shaped Window 自注意机制和局部增强位置编码等设计来提高建模性能,在常见的视觉任务中展现出了竞争力。
PDF
3 years ago
Prev
Next