提出一种基于卷积神经网络的 Region Proposal 方法 R-CNN,它与 CNN 结合起来使用更高的上下文信息,加上有监督的预培训方法,实现了在 PASCAL VOC 2012 数据集上的平均准确率 mAP 达到 53.3%。
Nov, 2013
本研究提出基于卷积神经网络的物体检测系统,使用基于贝叶斯优化的搜索算法和结构化 loss 进行物体定位,实验证明两种方法的结合优于先前的最先进方法。
Apr, 2015
本文提出了一种综合局部外观特征,对象关系的上下文信息和全局场景上下文特征的集合物体检测系统,该系统采用基于对象建议的完全连接条件随机场(CRF)进行建模,并利用快速平均场近似方法有效地进行 CRF 模型中的推理,实验结果表明,与基线算法 Faster R-CNN 相比,我们的方法在 PASCAL VOC 2007 数据集上实现了更高的平均精度(mAP).
Apr, 2016
本论文涉及基于区域的检测器,使用卷积网络实现高效的物体检测,使用位置敏感的得分图解决分类中的平移不变性和物体检测中的平移可变性的问题,可自然地采用全卷积图像分类器骨干网进行物体检测,以 101 层残差网络 (ResNet) 在 PASCAL VOC 数据集上取得 83.6% mAP 的竞争性结果,测试时间为每张图像 170ms,比 Faster R-CNN 快 2.5-20 倍。
May, 2016
本文介绍了如何在最小化计算成本的同时,通过采用和组合最新技术创新来实现多类别物体检测任务的最先进准确度。设计原则是 “少通道多层”,采用了一些基本块,包括拼接 ReLU、Inception 和 HyperNet, 在 VOC2007 上达到 83.8%的 mAP,VOC2012 为 82.5%mAP(第 2 名),仅使用 Intel i7-6700K CPU 单核时,每张图像仅需 750ms,在 NVIDIA Titan X GPU 上为 46ms / 图像,其网络与 ResNet-101 相比,计算成本只需 12.3%。
Aug, 2016
本文介绍了一种基于概率的新型物体定位方法,通过在搜索区域中分配条件概率来实现物体边界框的精确推断,实验证明该方法可以显著提高目标检测性能,并且可以与现有的物体检测系统很容易地集成使用。
Nov, 2015
本文提出了一种基于目标分割来提高目标检测准确性的方法,经过实验在 PASCAL VOC 2010 数据集上相对于 R-CNN 基线与当前最先进的方法,准确度分别提高了 4.1% 和 3.4%。
Feb, 2015
本论文提出了一种联合多任务网络设计,用于同时学习目标检测和语义分割,以实现低功耗嵌入式 SOC 上的实时性能,并在两个公共数据集(KITTI,Cityscapes)和私人鱼眼相机数据集中评估提出的网络。
Jan, 2019
该研究提出了一种基于显著性启发的神经网络模型,可以有效地在图像中检测出包含任何感兴趣的对象的一组类不可知的边界框,而不需要针对每个实例复制输出,并在 VOC2007 和 ILSVRC2012 上获得了具有竞争力的识别性能。
Dec, 2013
采用 DeepEnsembleCoco 的方法,利用 R-CNN 模型与深度 CNN 模型的集成来实现在目标检测方面取得最新的成果,并且在 PASCAL VOC 2012 比赛中的表现已超过以往所有的方法。
Jun, 2015