CNN 图像检索借鉴 BoW:基于 Hard Examples 的无监督微调
本研究提出了一种基于 3D 模型的卷积神经网络 Fine-Tuning 方法,并使用该方法在 VGG 网络上取得了 Oxford Buildings、Paris、Holidays 数据集上的最新成果,此方法可通过可选的正或负样本增强目标物体检索性能。
Nov, 2017
该论文提出了一种基于卷积神经网络的图像检索方法,采用三元组损失函数和表面重投影技术,获得了丰富的训练数据和有效的表征。该方法可用于 3D 重建中匹配图像检索问题,优于当前主流方法,显著加速了图像检索过程。
Nov, 2018
本文介绍了一种新的架构和方法,用于无监督目标识别,自动提取 CNN 模型中的特征,并将其与基于 Hopfield 网络的联想记忆库结合使用,消除了监督深度学习中的反向传播,提供了良好性能。
May, 2018
该论文提出了一种基于课程学习的弱监督学习方法,通过对大规模网络图像数据进行无人工标注的深度神经网络训练,实现对大量噪声数据和数据分布不均等问题的有效处理和噪声标签的负面影响的显著降低,构建一种新的课程学习架构,使得使用高噪声标签的图像作为一种正则化策略可以惊人地提高模型的泛化能力,在 WebVision、ImageNet、Clothing-1M 和 Food-101 等四个基准测试中取得了最先进的性能,多模型集成的结果在 1000 种类别分类中取得了 5.2% 的 top-5 错误率,相对误差率超过 50%。
Aug, 2018
本文旨在探讨深度卷积神经网络特征对无监督问题的可迁移性,并研究不同的预训练卷积神经网络特征提取器对于图像集群聚类和细粒度分类问题的影响,提出结合预训练的 ImageNet 中的深度特征提取和经典的聚类算法管道的分类方法,在图像聚类方面优于现有算法。作者同时在机器人应用中验证了该方法,成功实现了一种智能物体分类和存储的方案。
Jul, 2017
本文提出了一种使用大量网络数据来学习 CNN 的方法。具体地,我们利用了课程学习的思想,提出了一种 CNN 训练的两步方法,表现优异且鲁棒性强。我们使用这种方法在 VOC 2007 上实现了最佳性能,并在其中演示了网络监督学习的强大功能。
May, 2015
通过构建一个 5822 张图片数据集并使用五层 CNN 网络结构,利用几何变换的数据扩充技术来提高训练图片的数量,利用支持向量机(SVM)和 Bag-of-features(BoF)来进行食品图片识别,最终达到超过 90% 的准确率,有效避免 CNN 过度训练问题。
Dec, 2016
本文提出了一种新颖的框架用于图像检索,通过采用各种掩码方案从卷积特征中选择代表性的子集来解决爆炸性问题,并采用最新的嵌入和聚合方法进一步提高特征可区分性,从而达到了最先进的检索准确度。
Jul, 2017
本文提出了一个基于卷积神经网络的局部特征编码和基于词袋模型的实例检索方法,该方法将每个卷积层中的局部激活函数数组映射到可视化词汇中,从而实现了空间重新排序和检索的目的,并在 Oxford 和 Paris buildings benchmarks 中取得了具有竞争力的性能表现。
Apr, 2016
本文提出一个新的基于深度学习的交互分割框架,该框架将卷积神经网络(CNN)引入到边界框和涂鸦分割管道中,并提出了图像特定的微调和考虑网络和交互不确定性的加权损失函数来提高 CNN 模型的性能,实验结果表明我们的方法比现有的 CNN 方法更鲁棒,并能够在更少的用户交互和更短的时间内获得准确的分割结果。
Oct, 2017