BriefGPT.xyz
大模型
Ask
alpha
关键词
conceptual captions
搜索结果 - 2
CVPR
概念 12M:推动网页规模的图像文本预训练,以识别长尾视觉概念
通过松弛 Conceptual Captions 3M (CC3M) [Sharma et al. 2018] 数据收集流程,我们引入了 Conceptual 12M(CC12M)数据集,并通过针对长尾视觉识别的多个下游任务基准测试其有效性
→
PDF
3 years ago
跨领域理解引导式图像字幕性能
本文提出了一种使用指导文本来控制图像标题关注点的方法,使用基于 Transformer 的多模态编码器来生成标题,通过使用引导文本和全球和物体级别图像特征生成早期融合表示来生成标题,指导标题模型可较好地泛化用于外部领域的图像和指导文本,提高
→
PDF
4 years ago
Prev
Next