卷积神经网络编码多少位置信息?
本论文研究了卷积神经网络(CNNs)中位置信息的编码方式和其对语义表征的影响,通过设计新颖的任务和语义目标测试终止边界对语义表征的影响,揭示零填充驱动 CNNs 在其内部表征中进行位置信息编码的新发现,并证明位置信息既可以帮助也可以阻碍性能。
Jan, 2021
本文挑战了将三维卷积神经网络中的空间维度通过全局池化折叠成向量会删除所有空间信息的普遍假设,并证明了基于通道维度排序编码位置信息,而语义信息大多不是。其次,我们提出了简单而有效的数据增强策略和损失函数以提高 CNN 输出的平移不变性,以及一种有效确定潜在表示中哪些通道负责编码整体位置信息或区域特定位置信息的方法。这些发现将受益于关注 CNN 特征的研究领域。
Aug, 2021
本文挑战了现代 CNN 中卷积层具有平移不变性的普遍假设,并展示了 CNN 可以和将利用绝对空间位置来学习仅响应于特定绝对位置的滤波器,进而利用图像边界效应来达到效果。我们提供了一个简单的解决方案来消除空间位置编码,从而提高平移不变性,因此在小数据集方面提供更强的视觉归纳偏差。我们在几种体系结构和各种应用程序(例如图像分类、补丁匹配和两个视频分类数据集)中广泛展示了这些好处。
Mar, 2020
本研究提出新的测量位置信息强度的度量方法,指出现有度量方法存在局限性,证明采用现有或新的页面方案,均主要是学习因素,而非其本身特征,并提供了 PPP(Padding 产生的位置信息模式)的定义和可视化方法。
Jun, 2022
该研究使用特征打乱的方法,结合 CNNs 的最小可识别构型分析和有效接受域尺寸的系统控制,探索了 CNNs 在对象分类中是否使用特征的空间排列,并且发现它们实际上能够利用相对较远的空间关系进行对象分类,同时证明 CNNs 使用的空间关系程度非常依赖于特定数据集和该数据集中不同类别对象的分类策略也不同。最后,研究还发现 CNNs 只能学习特征的中间粒度的空间排列,这提示了在对象分类中中间层次的形状特征提供了敏感度和特异性之间的最佳平衡点。
Dec, 2022
本篇论文提出两种方法来量化 CNN 潜在空间中语义信息的相似度,以解决模型透明性问题。通过将这些方法应用于三种不同的目标检测器和两个数据集,我们的研究表明相似的语义概念是在所有 CNN 体系结构中学习的,且相似的概念出现在相似的相对层深度中,而与总层数无关。该研究成果有望实现 CNN 模型选择的知情和语义信息处理的理解。
Apr, 2023
本文通过严格的评估探索了不同的深度学习架构,比较它们在公共领域的性能,并识别和披露了重要的实现细节,同时指出了 CNN 基础表示的几个有用属性,包括输出层维度可以显著降低而不会对性能产生不利影响,以及深浅层方法可以成功共享的方面。
May, 2014
本研究探讨了卷积神经网络激活特征在需要对应关系的任务中的有效性,通过实验结果表明,这些特征在局部细节定位方面有更好的表现,并且在对象部分对齐和关键点预测方面优于传统的手工特征。
Nov, 2014
本文介绍了一种基于 CNN 模型的场所识别技术,在空间和时间维度上使用组合得到 CNN 模型的强大特征,并应用于一些基准数据集进行评估,该技术在召回率上取得了 75%的提升和 100%精度,明显优于之前所有的最新技术。在本文中,还对所有 21 个层的特征进行了全面的性能比较,包括基准数据集和一个具有更大视角变化的第二个数据集。
Nov, 2014