Nov, 2015

图像不会骗人:将深度视觉语义特征传递到大规模多模态学习中的排序

TL;DR本文介绍了一种多模式学习排序模型,它将传统特征和来自深度卷积神经网络的视觉语义特征相结合,用于电子商务中的搜索结果排序。在 Etsy 线上商场的大规模实验中,我们验证了多模式表示显著提高了排名质量,并展示了图像信息成功解开了文本模型难以区分的高度不同物品对的面纱。