Dec, 2012

用于建模互联网图像、标签及其语义的多视图嵌入空间

TL;DR本文探讨了基于互联网图像和相关文本标签的图像搜索、标签搜索和图像注释等任务,采用典型相关分析(CCA)方法将视觉和文本特征映射到同一隐藏向量空间,在此基础上,引入了表示高级图像语义的第三个视图来训练三个视图的嵌入,并结合多种视觉特征进行训练,实现了高效的嵌入式检索。