图像检索的神经编码
本文主要研究如何通过量化、编码、剪枝和权值共享等技术减小深度神经网络模型的规模,以解决基于卷积神经网络的全局图像描述符在图像实例检索任务上面临的储存问题,研究结果表明,最小化模型大小能够在不影响检索结果的情况下减小两个数量级的规模。
Jan, 2017
本文提出了一种基于目标图像预测的语义信息的局部感知编码方法,在图像检索中使用卷积神经网络和类激活图进行无监督重排和目标检测,证明了其在 Oxford5k 和 Paris6k 等公共数据集上的优越性能。
Jul, 2017
应用深度学习的方法解决在损失图像和视频压缩中提高视觉质量的问题,通过训练一个特定的卷积神经网络,实现对图像语义的理解,并通过对每个对象训练特征的方式生成高质量的压缩图像。
Dec, 2016
通过对自然信号变异性更可预测的表征重新审视并改进对比性预测编码的无监督目标,可以实现数据高效的图像识别,其特征支持 ImageNet 数据集上最先进的线性分类准确性,同时可在非线性分类中使用 2-5 倍的标签,最终,这种无监督表征大大改善了 PASCAL VOC 数据集的对象检测的迁移学习。
May, 2019
本文提出了一种使用局部聚合描述符(VLAD)将空间金字塔 CNN 特征编码的方法,以更准确地反映图像的局部信息。结果表明,使用 VLAD 编码可以仅使用 3%的维度匹配 CNN 特征,并与空间金字塔结合使用可以更准确地将局部元素考虑在内。
Mar, 2016
本文研究使用卷积网络所提供的图像表示在视觉实例检索任务中的可用性,并通过利用多尺度图像特征提取方案,特别地,通过将几何不变性纳入到明确的位置、尺度和空间一致性中的方法来提取来自于该网络的局部特征,实验结果表明,如果对其进行适当提取,那么通用卷积网络图像表示法可优于其他先进方法。
Dec, 2014
本文研究采用卷积神经网络在图像检索中的应用,通过提取不同层的卷积特征,使用 VLAD 编码转化为一个单一向量,探讨不同层和规模在特征处理中的影响,发现较低的层次和更精细的尺度能够更好地提升图像检索的准确度,同时对比了其他方法,最终取得了业界领先的成果。
Apr, 2015
本研究提出了一种基于 3D 模型的卷积神经网络 Fine-Tuning 方法,并使用该方法在 VGG 网络上取得了 Oxford Buildings、Paris、Holidays 数据集上的最新成果,此方法可通过可选的正或负样本增强目标物体检索性能。
Nov, 2017
本文提出了一种利用深度卷积神经网络学习特征进行文档图像分类和检索的最新技术,证实与手工制作的替代方法相比,能够更好地学习抽象特征,且具有压缩鲁棒性和跨领域迁移性,并在新的 IIT-CDIP 数据集中提供了 400,000 个文档图像用于深度学习。
Feb, 2015
该研究旨在利用卷积神经网络及非局部冗余优化视频压缩,达到与预处理去噪 CNN 类似的编码增益,同时只需要约为 1% 的计算复杂度,适用于资源受限的条件下进行视频压缩。
Oct, 2019