BriefGPT.xyz
大模型
Ask
alpha
关键词
textual grounding
搜索结果 - 3
无需进一步训练即可将 CLIP 用于短语定位
利用对比语言 - 视觉模型 CLIP,我们可以实现无需人工注释或额外训练的短语定位方法,其零样本短语定位性能优于现有无训练方法,并在某些情况下甚至超过了有监督的方法。
PDF
2 years ago
NIPS
可解释的、全局最优的基于图像概念的文本 grounding 预测
本文研究了文本 grounding 的问题,提出了一种统一的框架来有效地搜索所有可能的 bounding box 提议,通过训练的模型参数作为 word-embedding,实现了空间 - 图像关系的捕捉和解释性,实验表明本方法在 Flic
→
PDF
6 years ago
CVPR
无监督文本 grounding: 将词语与图像概念相连
本研究提出了一种基于深度学习的无监督的文本 grounding(文本与图像上物体的对应关系)方法,并在 ReferIt Game 数据集与 Flickr30k 数据集上分别超过了基线 7.98% 和 6.96%。
PDF
6 years ago
Prev
Next