BriefGPT.xyz
大模型
Ask
alpha
关键词
image-sentence pairs
搜索结果 - 2
ICCV
从自然语言监督中学习生成场景图
本文提出了一种通过图像 - 句子对学习的方法,以提取图像中本地化对象及其关系的图形表示,即场景图,其中利用了现成的对象检测器来识别和定位对象实例,并通过掩码标记预测任务预测伪标签以学习场景图。通过学习图像 - 句子对,我们的模型相较于使用人
→
PDF
3 years ago
探索图像 - 语言变换器的动词理解
本文研究多模态图像语言变换器的预训练表示质量,研究表明在需要谓语理解的情况下这些模型的表现不佳,通过图像 - 语句对数据集评估模型性能,分类词汇类型并找到特别具有挑战性的词汇类型。
PDF
3 years ago
Prev
Next