关键词visual semantic embedding
搜索结果 - 2
- CVPR组合对象关系和属性进行图像 - 文本匹配
本研究中,我们通过引入场景图表示图像标题,利用图注意力网络构建了一个双编码器的图像 - 文本匹配模型,能高效地编码物体 - 属性和物体 - 物体的语义关系,通过提供对图神经网络的强关系归纳偏置进行学习。我们的模型在两个重要的图像 - 文本检 - CVPR学习视觉语义嵌入的最佳池化策略
Visual Semantic Embedding 使用多模态特征进行复杂的嵌入,但该研究发现,全局池化函数(例如最大池化)的简单选择优于这些复杂的模型,因此,它们提出了一个名为 GPO 的广义池化运算符来自动适应不同特征的最佳池化策略,并