BriefGPT.xyz
Ask
alpha
关键词
global context vision transformer
搜索结果 - 1
全局上下文视觉 Transformer
本文介绍了一种新的计算机视觉模型 GC ViT,核心是全局上下文自注意力模块,结合标准本地自注意力来有效地建模长程和短程空间交互关系,解决了 ViTs 的归纳偏差问题,在图像分类、对象检测和语义分割等任务中实现了新的最高性能表现。
PDF
2 years ago
Prev
Next