SIGIRJun, 2016

将文本描述转化为高层视觉表征

TL;DR本文介绍了一种利用神经网络模型 Text2Vis 在视觉特征空间中实现基于短文本描述信息的图像搜索方法,并通过针对文本和视觉损失函数的优化来提高搜索效率和精确度,并在 MS-COCO 数据集上进行了初步结果呈现。