BriefGPT.xyz
Ask
alpha
关键词
flickr 30k entities
搜索结果 - 2
NIPS
可解释的、全局最优的基于图像概念的文本 grounding 预测
本文研究了文本 grounding 的问题,提出了一种统一的框架来有效地搜索所有可能的 bounding box 提议,通过训练的模型参数作为 word-embedding,实现了空间 - 图像关系的捕捉和解释性,实验表明本方法在 Flic
→
PDF
6 years ago
ECCV
文本短语重建图像基础
通过采用注意力机制来重构给定的短语,本论文提出了一种新的接近无监督学习的方法来学习 grounding,该方法不需要太多的地面实时监督,有效提高了在 Flickr 30k 实体数据集上的表现。
PDF
9 years ago
Prev
Next