ICCVAug, 2021

全局池化,不止眼见所及: CNN 中位置信息以通道方式编码

TL;DR本文挑战了将三维卷积神经网络中的空间维度通过全局池化折叠成向量会删除所有空间信息的普遍假设,并证明了基于通道维度排序编码位置信息,而语义信息大多不是。其次,我们提出了简单而有效的数据增强策略和损失函数以提高 CNN 输出的平移不变性,以及一种有效确定潜在表示中哪些通道负责编码整体位置信息或区域特定位置信息的方法。这些发现将受益于关注 CNN 特征的研究领域。