CVPRNov, 2016

基于 Sketch 的视觉搜索中三元组卷积神经网络的泛化和共享

TL;DR本研究提出和评估了几种三元 CNN 结构,用于在素描和照片之间测量相似度,重点研究网络在有限的训练数据下的分类能力,探究了权值共享、预处理、数据增强和降维等策略,并在 250 个 TU-Berlin 分类数据集上进行训练,结合从互联网上采集的 25,000 张对应照片,相较于现有技术在 Flickr15k 和 TU-Berlin SBIR 基准上分别提升了 18% 和 10 个标准差。