BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodality guidance
搜索结果 - 1
MVP: 多模态引导的视觉预训练
本文介绍了一种名为 Multimodality-guided Visual Pre-training (MVP) 的方法,该方法利用来自其他几个模态的指导信息对图像进行预训练,取代了 Vision Transformer 中的 tokeni
→
PDF
2 years ago
Prev
Next