ICCVAug, 2017

通过连接图像内容和歌词检索歌曲

TL;DR本文提出一种基于语义的图像检索语音的解决方案,通过深度学习模型生成标签,使用神经网络建模歌词,并基于多层感知器建立图像和歌词之间的语义相关性,实验结果显示出明显的检索表现力。