MDFN: 目标检测的多尺度深度特征学习网络
本文提出了多尺度卷积神经网络(MS-CNN)用于实现快速的多尺度目标检测。并通过一个 proposal sub-network 和一个 detection sub-network 实现了 end-to-end 的联合训练,同时还探索了使用反卷积代替输入插值以减少内存和计算成本的方法。最后在 KITTI 和 Caltech 等数据集上实现了超过 15fps 的最先进的目标检测表现。
Jul, 2016
该论文介绍了基于深度卷积网络的 Feature Pyramid Network(FPN),该网络利用深度卷积网络自带的金字塔多尺度特征,并在多种应用中取得了重大改进,尤其是在目标检测上。使用 FPN 的 Faster R-CNN 系统在 COCO 检测基准测试中取得了最先进的单模型结果。此外,该方法能够在 GPU 上以 5 FPS 的速度运行,是一种实用且准确的多尺度目标检测解决方案。
Dec, 2016
本文提出了一种称为多级特征金字塔网络(MLFPN)的方法,通过融合多级特征从而构建更有效的特征金字塔用于检测不同尺度的对象,并且将 MLFPN 集成到 SSD 中构建了名为 M2Det 的一阶段强大的端到端对象检测器,在 MS-COCO 基准测试中以单尺度推理策略实现了 AP 41.0,以多尺度推理策略实现了 AP 44.2,这是一阶段检测器中的新的最佳结果。
Nov, 2018
MFDS-Net 是一种基于全局语义和细节信息的多尺度特征深度监督网络,旨在更精细地描述变化的建筑和地理信息,增强变化目标的定位和弱特征的提取。
May, 2024
本文提出了一种名为 MLF-DET 的新颖有效的多级融合网络,用于高性能跨模态 3D 物体检测,它将特征级融合和决策级融合相结合,充分利用图像中的信息。
Jul, 2023
本文提出多阶段变形卷积神经网络用于目标检测,使用新的变形约束池化层来建模对象部分的变形,并提出多阶段训练策略和预训练策略来优化多个难度级别的分类器以及改变神经网络结构、训练策略来得到一组具有较大多样性的模型,在 ILSVRC 2014 中排名第二,显著提高了目标检测的平均精度。
Sep, 2014
本文提出的基于图形特征金字塔网络的多尺度特征学习方法,在对象检测任务中优化了 Faster R-CNN 算法,并超越了之前的最先进特征金字塔算法和其他流行的检测方法。
Aug, 2021
本文提出了 DP-FCN,一种深度学习模型,可专门适应具有可变形部件的对象形状,从而实现目标检测,其主要模块包括:完全卷积网络、基于可变形部件的 RoI 池化层和变形感知定位模块,实验证明 DP-FCN 在 PASCAL VOC 2007 和 2012 数据集上均取得了 83.1% 和 80.9% 的最新性能表现。
Jul, 2017
本文提出了一种名为 DFANet 的极其高效的卷积神经网络架构,用于在资源有限的情况下进行语义分割。通过子网络和子阶段级联聚合区分特征,通过多尺度特征传播,DFANet 大大减少了参数数量,并提高了模型学习能力,在速度和分割性能之间取得平衡。在 Cityscapes 和 CamVid 数据集上的实验证明了 DFANet 具有比现有最先进的实时语义分割方法快 2 倍,FLOPs 少 8 倍的卓越性能,同时提供可比较的准确性。具体而言,它在 Cityscapes 测试数据集上实现了 70.3%的 IOU 平均值,仅使用 1.7 GFLOPs,并在一张 NVIDIA Titan X 卡上以 160 FPS 的速度进行推断,在更高分辨率图像上推断时,实现了 71.3%的 IOU 平均值和 3.4 GFLOPs。
Apr, 2019
本文提出了一种新的鲁棒性编码器解码器结构的神经网络,使用少量的训练示例进行端到端的训练,通过特征融合在 Feature Pooling Module 中提取多尺度特征,实现对相机运动的鲁棒特征池化,免去多尺度输入的需求,通过 CDnet2014、SBI2015 和 UCSD Background Subtraction 数据集的实验表明,所提出的方法的整体 F-Measure 平均值优于现有所有最先进的方法。
Aug, 2018