BriefGPT.xyz
Ask
alpha
关键词
multimodality inputs
搜索结果 - 1
ECCV
UNITER: 通用图像文本表示学习
本研究引入了 UNITER,一种通过对四个图像 - 文本数据集(COCO,Visual Genome,Conceptual Captions 和 SBU Captions)进行大规模预训练学习的 UNiversal image-text r
→
PDF
5 years ago
Prev
Next