BriefGPT.xyz
大模型
Ask
alpha
关键词
segmentation transformer
搜索结果 - 1
CVPR
视觉 Transformer: 从语义分割到密集预测
本研究首次探索视觉变换器(ViT)的全局上下文学习潜力以实现密集视觉预测,编码图像作为一系列补丁并学习全局上下文,使 ViT 可以捕获更强的长距离依赖信息,提出的分割转换器(SETR)在 ADE20K 和 Pascal Context 数据
→
PDF
2 years ago
Prev
Next