BriefGPT.xyz
大模型
Ask
alpha
关键词
semantic visual tokens
搜索结果 - 2
使用语义有意义的标记理解视觉表示学习的效果
在视觉 - 语言预训练框架中,通过提供语义上有意义的视觉标记给 transformer 编码器,本文探索了视觉 transformer 在学习综合和组合性视觉数据表示方面的限制,并通过使用现成的分割和场景图模型,提取了实例分割掩码(称为有形
→
PDF
a month ago
视觉 Transformer:面向计算机视觉的基于令牌的图像表示和处理
本文通过使用视觉 Transformer 在语义标记空间中密集地建模标记关系并减少卷积计算量,从而在 ImageNet top-1 和 LIP,COCO-stuff 图像分割测试上表现出了显着的优势。
PDF
4 years ago
Prev
Next