DeepID-Net: 可变形深度卷积神经网络用于目标检测

CVPRDec, 2014

DeepID-Net: 可变形深度卷积神经网络用于目标检测

DeepID-Net: Deformable Deep Convolutional Neural Networks for Object Detection

Wanli Ouyang, Xiaogang Wang, Xingyu Zeng, Shi Qiu, Ping Luo...

TL;DR本文提出了一种新的深度学习目标检测框架，引入了变形卷积神经网络、约束池化层等创新，通过组合不同的网络结构和组件、改变训练方法等方式，提高了模型的泛化能力和检测精度，实验结果表明该方法在 ILSVRC2014 比赛中的表现明显优于 RCNN 和 GoogleNet，能有效提升目标检测效果。

Abstract

In this paper, we propose deformable deep convolutional neural networks for generic object detection. This new deep learning object detection

deformable deep convolutional neural networks object detection def-pooling layer pre-training strategy model averaging

发现论文，激发创造

DeepID-Net: 多阶段和可形变深度卷积神经网络用于目标检测

本文提出多阶段变形卷积神经网络用于目标检测，使用新的变形约束池化层来建模对象部分的变形，并提出多阶段训练策略和预训练策略来优化多个难度级别的分类器以及改变神经网络结构、训练策略来得到一组具有较大多样性的模型，在 ILSVRC 2014 中排名第二，显著提高了目标检测的平均精度。

Sep, 2014

基于可变形部件的全卷积网络用于目标检测

本文提出了 DP-FCN，一种深度学习模型，可专门适应具有可变形部件的对象形状，从而实现目标检测，其主要模块包括：完全卷积网络、基于可变形部件的 RoI 池化层和变形感知定位模块，实验证明 DP-FCN 在 PASCAL VOC 2007 和 2012 数据集上均取得了 83.1% 和 80.9% 的最新性能表现。

Jul, 2017

DANet：通过高效的变形注意力网络提升小目标检测

在制造环境中，高效准确地检测小型物体，如缺陷和裂纹，对于确保产品质量和安全至关重要。我们提出了一种综合策略，通过将 Faster R-CNN 与先进的方法结合起来，有效解决了这个问题。我们的模型在 NEU-DET 和 Pascal VOC 数据集上进行了严格评估，验证了其鲁棒的性能和通用性。在 NEU-DET 数据集上，我们的模型表现出对钢铁缺陷的深入理解，在识别各种缺陷方面实现了最先进的准确性。同时，在 Pascal VOC 数据集上评估时，我们的模型展示了在复杂且小型场景中检测各类对象的能力。

Oct, 2023

可变形卷积神经网络

本文证明卷积神经网络的固定几何结构导致其在几何变换方面受限，从而引入了两个新模块增强 CNNs 的变换建模能力。这两个模块是可变形卷积和可变形 RoI 池化。这些新的模块可以轻松替换现有 CNNs 中的普通模块，并且可以通过标准反向传播进行端到端训练，从而产生可变形卷积网络。广泛的实验证实了这种方法在物体检测和语义分割的复杂视觉任务上的有效性。

Mar, 2017

Deformable ConvNets v2：更加可变形，更好的结果

通过增强 Deformable Convolutional Networks 的变形卷积能力、引入调制机制和特征模仿方案，提高了其在目标检测和实例分割任务中的性能表现。

Nov, 2018

可变形 PV-RCNN: 利用学习形变改善三维物体检测

Deformable PV-RCNN 利用 2D deformable convolution networks 设计的 proposal refinement module 以及 context gating 机制，实现适应不同目标尺度和点云稠密度的高效 3D 物体检测。

Aug, 2020

PVANET: 实时目标检测的深度轻量级神经网络

本文介绍了如何在最小化计算成本的同时，通过采用和组合最新技术创新来实现多类别物体检测任务的最先进准确度。设计原则是 “少通道多层”，采用了一些基本块，包括拼接 ReLU、Inception 和 HyperNet，在 VOC2007 上达到 83.8％的 mAP，VOC2012 为 82.5％mAP（第 2 名），仅使用 Intel i7-6700K CPU 单核时，每张图像仅需 750ms，在 NVIDIA Titan X GPU 上为 46ms / 图像，其网络与 ResNet-101 相比，计算成本只需 12.3％。

Aug, 2016

PVANet：用于实时目标检测的轻量化深度神经网络

该论文提出了一种全新的、比其他最先进的网络轻一个数量级的网络结构，基于更少通道的深度学习原理，通过采用 C.ReLU 和 Inception 结构等技术创新，使这个深度神经网络最小化其冗余，同时在计算成本小于最近的 ResNet-101 的情况下能够高效地训练，从而在知名的目标检测基准测试上实现了 84.9% 和 84.2% 的 mAP。

Nov, 2016

卷积神经网络实现高效的物体定位

通过深度卷积网络及位置细化模型使人体姿态的关节定位精度得到提升

Nov, 2014

深度卷积神经网络中的零件检测器发现

本文提出了一种基于预训练卷积神经网络的物体部位发现和定位方法 PDD，通过分析网络输出的梯度映射并找到与语义部分或边界框有空间关系的激活中心，实现对 CUB200-2011 数据集进行优秀的监测和分类性能，同时不需要在测试期间给定边界框或计算真假部分。

Nov, 2014