CVPRApr, 2018

Video2Shop: 在视频中准确匹配服装到在线购物图片

TL;DR本文提出了一个名为 AsymNet 的深度神经网络,并使用此网络解决了一个新的跨领域问题 ——Video2Shop,该问题针对的是将视频中出现的衣服与在线商店中的完全相同的物品进行匹配。AsymNet 采用了很好的方法从视频中提取特征,并使用 LSTM 框架对视频进行序列建模,以捕捉视频中的时间动态。为了准确匹配视频和在线购物图像,AsymNet 利用可重构的深层树结构下的相似性网络来联合建模 LSTM 隐藏状态和图像特征。作者还提出了一种近似训练方法来实现训练的效率,并在大型跨领域数据集上进行了广泛实验,证明了所提出的 AsymNet 的有效性和效率,它优于现有的最先进方法。