卷积神经网络编码多少位置信息？

ICLRJan, 2020

卷积神经网络编码多少位置信息？

How Much Position Information Do Convolutional Neural Networks Encode?

Md Amirul Islam, Sen Jia, Neil D. B. Bruce

TL;DR本文通过一系列实验发现卷积神经网络在学习卷积核的时候竟然能够隐式地编码图片中绝对位置的信息。

Abstract

In contrast to fully connected networks, convolutional neural networks (CNNs) achieve efficiency by learning weights associated with local filters with a finite spatial extent. An implication of this is that a fi

convolutional neural networks local filters position information deep learning image

发现论文，激发创造

CNN 中位置信息的深入研究：位置、填充和预测

本论文研究了卷积神经网络（CNNs）中位置信息的编码方式和其对语义表征的影响，通过设计新颖的任务和语义目标测试终止边界对语义表征的影响，揭示零填充驱动 CNNs 在其内部表征中进行位置信息编码的新发现，并证明位置信息既可以帮助也可以阻碍性能。

Jan, 2021

全局池化，不止眼见所及: CNN 中位置信息以通道方式编码

本文挑战了将三维卷积神经网络中的空间维度通过全局池化折叠成向量会删除所有空间信息的普遍假设，并证明了基于通道维度排序编码位置信息，而语义信息大多不是。其次，我们提出了简单而有效的数据增强策略和损失函数以提高 CNN 输出的平移不变性，以及一种有效确定潜在表示中哪些通道负责编码整体位置信息或区域特定位置信息的方法。这些发现将受益于关注 CNN 特征的研究领域。

Aug, 2021

卷积神经网络中的平移不变性：卷积层可以利用绝对空间位置

本文挑战了现代 CNN 中卷积层具有平移不变性的普遍假设，并展示了 CNN 可以和将利用绝对空间位置来学习仅响应于特定绝对位置的滤波器，进而利用图像边界效应来达到效果。我们提供了一个简单的解决方案来消除空间位置编码，从而提高平移不变性，因此在小数据集方面提供更强的视觉归纳偏差。我们在几种体系结构和各种应用程序（例如图像分类、补丁匹配和两个视频分类数据集）中广泛展示了这些好处。

Mar, 2020

透过图像特征的迷雾揭示位置信息模式的面纱

本研究提出新的测量位置信息强度的度量方法，指出现有度量方法存在局限性，证明采用现有或新的页面方案，均主要是学习因素，而非其本身特征，并提供了 PPP（Padding 产生的位置信息模式）的定义和可视化方法。

Jun, 2022

一种新的特征混淆方法揭示了卷积神经网络学习空间关系的能力

该研究使用特征打乱的方法，结合 CNNs 的最小可识别构型分析和有效接受域尺寸的系统控制，探索了 CNNs 在对象分类中是否使用特征的空间排列，并且发现它们实际上能够利用相对较远的空间关系进行对象分类，同时证明 CNNs 使用的空间关系程度非常依赖于特定数据集和该数据集中不同类别对象的分类策略也不同。最后，研究还发现 CNNs 只能学习特征的中间粒度的空间排列，这提示了在对象分类中中间层次的形状特征提供了敏感度和特异性之间的最佳平衡点。

Dec, 2022

卷积神经网络实现高效的物体定位

通过深度卷积网络及位置细化模型使人体姿态的关节定位精度得到提升

Nov, 2014

卷积神经网络的量化语义比较

本篇论文提出两种方法来量化 CNN 潜在空间中语义信息的相似度，以解决模型透明性问题。通过将这些方法应用于三种不同的目标检测器和两个数据集，我们的研究表明相似的语义概念是在所有 CNN 体系结构中学习的，且相似的概念出现在相似的相对层深度中，而与总层数无关。该研究成果有望实现 CNN 模型选择的知情和语义信息处理的理解。

Apr, 2023

细节之魔归来：深入探究卷积神经网络

本文通过严格的评估探索了不同的深度学习架构，比较它们在公共领域的性能，并识别和披露了重要的实现细节，同时指出了 CNN 基础表示的几个有用属性，包括输出层维度可以显著降低而不会对性能产生不利影响，以及深浅层方法可以成功共享的方面。

May, 2014

卷积神经网络是否学习到对应关系？

本研究探讨了卷积神经网络激活特征在需要对应关系的任务中的有效性，通过实验结果表明，这些特征在局部细节定位方面有更好的表现，并且在对象部分对齐和关键点预测方面优于传统的手工特征。

Nov, 2014

基于卷积神经网络的地点识别

本文介绍了一种基于 CNN 模型的场所识别技术，在空间和时间维度上使用组合得到 CNN 模型的强大特征，并应用于一些基准数据集进行评估，该技术在召回率上取得了 75％的提升和 100％精度，明显优于之前所有的最新技术。在本文中，还对所有 21 个层的特征进行了全面的性能比较，包括基准数据集和一个具有更大视角变化的第二个数据集。

Nov, 2014