BriefGPT.xyz
大模型
Ask
alpha
关键词
conceptual captions dataset
搜索结果 - 3
CVPR
具有判别性微调的跨领域图像字幕生成
本文提出在自我监督的证明性沟通目标情况下对预先训练的神经字幕系统进行微调,使其生成更详细的图像描述,并在 Conceptual Captions 数据集上进行验证。
PDF
a year ago
探索图像 - 语言变换器的动词理解
本文研究多模态图像语言变换器的预训练表示质量,研究表明在需要谓语理解的情况下这些模型的表现不佳,通过图像 - 语句对数据集评估模型性能,分类词汇类型并找到特别具有挑战性的词汇类型。
PDF
3 years ago
ICLR
VL-BERT: 通用视觉语言表示的预训练
本研究引入一个新的预可训练的通用视觉语言表示方法 ——Visual-Linguistic BERT,它采用了简单而强大的 Transformer 模型作为骨干网络,并将视觉和语言嵌入特征扩展为输入。通过在大规模的 Conceptual Ca
→
PDF
5 years ago
Prev
Next