卷积神经网络是否学习到对应关系?
本文提出了一种基于目标图像预测的语义信息的局部感知编码方法,在图像检索中使用卷积神经网络和类激活图进行无监督重排和目标检测,证明了其在 Oxford5k 和 Paris6k 等公共数据集上的优越性能。
Jul, 2017
本文提出了一种深度学习框架,用于准确的视觉对应,并证明了其在几何和语义匹配中的有效性,提出了一种卷积空间变换器来模仿传统特征(如 SIFT)中的补丁归一化,广泛的 KITTI,PASCAL 和 CUB-2011 数据集的实验表明,与使用手工构建或学习特征的先前作品相比,我们的特征具有显着优势。
Jun, 2016
该研究使用特征打乱的方法,结合 CNNs 的最小可识别构型分析和有效接受域尺寸的系统控制,探索了 CNNs 在对象分类中是否使用特征的空间排列,并且发现它们实际上能够利用相对较远的空间关系进行对象分类,同时证明 CNNs 使用的空间关系程度非常依赖于特定数据集和该数据集中不同类别对象的分类策略也不同。最后,研究还发现 CNNs 只能学习特征的中间粒度的空间排列,这提示了在对象分类中中间层次的形状特征提供了敏感度和特异性之间的最佳平衡点。
Dec, 2022
本研究旨在探究卷积神经网络中的设计选择与改进,通过对 R-CNN 检测器的新注释的经验分析,发现现有的最先进的卷积神经网络架构对于不同外观因素不具备不变性,并且不能仅通过增加训练数据来解决问题,需要进行架构变化。在数据增强方面,利用图像渲染可以改善性能,该研究在 Pascal3D + 检测和视点估计任务上报告了最佳结果。
Aug, 2015
本文提出了基于 CNN 的视频对象分割算法,采用像素级匹配来区分目标区域和背景。提出了特征压缩技术,对大数据集进行实验,证明了模型在准确性、速度和稳定性方面的有效性,同时也介绍了模型在不同领域的可传递性。
Aug, 2017
本文介绍一种新技术 cross-convolutional-layer pooling,并探讨卷积层激活的图像表示方式在使用中的优点和不足,通过应用于四个流行的视觉分类任务,证明该方法具有可比较或显著更好的性能,而造成的计算成本要低得多。
Nov, 2014
本文探讨了在大型弱标记图像集上训练卷积网络以提升视觉特征表达的潜力,并证明了在 1 亿张 Flickr 图片与样本说明上训练出来的特征在多种视觉问题中表现良好,还能够妥善地捕捉单词之间的相似性,并学习不同语言之间的对应关系。
Nov, 2015