关键词semantic image retrieval
搜索结果 - 3
- AAAI使用相对相似性监督的场景图嵌入
本文探讨利用图卷积网络对场景图进行结构化表示并生成有用的语义图像嵌入的方法,通过相似性标签学习图像表示,提出一种新的排序损失函数并设计三元采样策略,实验表明此方法优于已知相似性损失,且能够很好地捕捉场景的全局信息。
- ICLR从视觉语言到学习层级离散语言单元
本文中提出了一种通过将向量量化层整合到基于视觉语音的神经模型中来学习离散语言单元的方法。我们展示了我们的方法可以捕捉到单词级别和子词级别的单元,我们还将子词单元应用到了 ZeroSpeech 2019 挑战中,取得了较好的结果。
- 基于网络数据的自监督学习在多模态检索中的应用
通过利用 Web 和 Social Media 数据,本文提出一种利用多模态图像和文本嵌入的自监督学习方法,在不需要人工注释的情况下学习强大的特征,并将文本领域学到的语义知识转移至视觉模型用于语义图像检索任务。研究分析了五种不同的文本嵌入方