BriefGPT.xyz
Ask
alpha
关键词
tangible tokens
搜索结果 - 1
使用语义有意义的标记理解视觉表示学习的效果
在视觉 - 语言预训练框架中,通过提供语义上有意义的视觉标记给 transformer 编码器,本文探索了视觉 transformer 在学习综合和组合性视觉数据表示方面的限制,并通过使用现成的分割和场景图模型,提取了实例分割掩码(称为有形
→
PDF
a month ago
Prev
Next