BriefGPT.xyz
Ask
alpha
关键词
multimodal similarity models
搜索结果 - 1
CVPR
从字幕到视觉概念的转换和回归
本文提出了一种用于自动生成图像描述的新方法:使用从图像标题数据集中直接学习的视觉探测器、语言模型和多模式相似模型。
PDF
10 years ago
Prev
Next