本文研究了全局平均池化技术在卷积神经网络中应用的原理,发现其可以使网络更好地实现局部特征定位,从而建立了一种通用的可局部化的深层表示方法,并通过实验证明其在物体定位等各种任务上的有效性。
Dec, 2015
本文提出了一种基于本地重要性建模的简单,通用且有效的池化层 LIP,它能够学习自适应重要性权重,从而提高下采样过程中的判别特征,在 ImageNet 分类和 MS COCO 数据集的目标检测中都取得了很好的性能。
Aug, 2019
提出了一种泛化的 alpha-pooling 方法,可以在训练中学习汇编策略,同时引入一种有效的决策可视化方法来分析语义组成对决策的影响,实验证明这个方法可以在各种标准数据集上优于传统的的平均池化和双线性池化方法。
May, 2017
本文介绍一种新技术 cross-convolutional-layer pooling,并探讨卷积层激活的图像表示方式在使用中的优点和不足,通过应用于四个流行的视觉分类任务,证明该方法具有可比较或显著更好的性能,而造成的计算成本要低得多。
Nov, 2014
通过引入新型的空洞汇聚层来丰富空间特征的表示,该方法在多个尺度上操作,能够自适应地学习分层特征,实验证明其在捕捉复杂空间模式和改进特征提取能力方面的有效性。
Apr, 2024
本文提出了一种新的算法,将病毒性预测问题重新定义为属性预测任务,并使用成对神经网络模型来模拟在线媒体图像的病毒性,对促进病毒性的特征提供了重要洞见,在预测方面比现有技术的平均值提高了 12%,我们还研究了外部类别监督对相对属性预测的影响,并观察到了准确度的提高.
Sep, 2017
本文提出了一种新的图像特征提取器 —— 局部关系层,它基于局部像素对的组合关系自适应地确定聚合权重,从而更高效地将视觉元素组合成更高级别实体,提供更好的语义推理,通过局部关系层构建的神经网络(LR-Net)在大规模识别任务中具有比其卷积网络更大的建模能力,如 ImageNet 分类。
Apr, 2019
本文从计算机视觉的角度研究了社交网络上在线内容的传播现象,引入来自 Reddit 的三个图像数据集,定义了传播度量,并使用最先进的图像特征训练分类器来预测图像的传播度,相对传播度和主题,通过相对属性识别了与传播度相关的 5 个主要视觉属性,在此基础上,创建了一个基于属性的图像特征描述模型,可以以 68.10% 的准确率(SVM + 深度相对属性)预测图像的相对传播度,高于 60.12% 的人类预测效果。最后,我们研究了在不同的上下文中,如相邻图像、最近查看的图像以及图像标题或说明文本的影响下,人类对图像传播度的预测如何变化。
Mar, 2015
该论文提出了一种无需使用空间信息的新型池化方法,可以学习图像序列的特征软聚类,从而改进特征的时间相干性,且在图像分类任务上表现优异。
Jan, 2013
本文提出了一种针对整个图像计算基于补丁的局部特征描述符的有效方法,适用于几乎所有现有的网络架构和局部特征提取任务,包括摄像机标定、Patchmatching、光流估计和立体匹配等任务,并对任意 CNN 架构进行了速度基准测试和示例代码的展示。
May, 2018