本文提出了一种 CNN 方法,名为 IoU-Net,以预测物体检测边界框的 IoU 值,使得模型具有定位置信度,进而提高非极大值抑制算法(NMS)的精度,在 MS-COCO 数据集上实验表明 IoU-Net 方法适用于多种先进的物体检测器且有效。
Jul, 2018
本研究提出基于卷积神经网络的物体检测系统,使用基于贝叶斯优化的搜索算法和结构化 loss 进行物体定位,实验证明两种方法的结合优于先前的最先进方法。
Apr, 2015
本文提出一种基于卷积神经网络和语义分割的目标检测系统,利用迭代定位机制,通过高效运用模块来检测物体,并在 PASCAL VOC 数据集上获得了比其他方法更高的检测精度。
May, 2015
该研究提出了一种基于显著性启发的神经网络模型,可以有效地在图像中检测出包含任何感兴趣的对象的一组类不可知的边界框,而不需要针对每个实例复制输出,并在 VOC2007 和 ILSVRC2012 上获得了具有竞争力的识别性能。
Dec, 2013
介绍了一种新方法,利用深度卷积神经网络对整张图片进行训练,以在不额外进行人工监督的情况下定位图像中的物体,并将该思想嵌入凝聚聚类技术中,产生自学习定位假设。实验证明,使用我们的方法自动生成的注释可用于训练物体探测器,产生接近于手动注释的边界框的识别结果。
Sep, 2014
LSNet 是一个深度神经网络,能够根据感兴趣目标的锚点和标志点确定目标的形状,其采用新型的损失函数进行优化,可在提高准确率的同时具有更好的融合信息的性能。实验证明,LSNet 能够在定位敏感型的视觉识别任务中创造最新的准确率记录,成为新一代无锚点目标检测和实例分割的领跑者,并能够有效检测多尺度的人体姿态。
Apr, 2021
本文提出了一个名为 ProNet 的基于神经网络的结构,利用图像级注释来高效地实现物体的分类和定位,并在 PASCAL VOC 2012 以及 MS COCO 数据集上进行了实验,超出了之前最先进的技术。
Nov, 2015
本文提出了深层分层网络 HyperNet,以处理区域提案生成和目标检测。HyperNet 基于精心设计的超级特征,将图像的深层、中间和浅层特征结合在一起,实现了端到端的联合训练策略,并在每张图像使用仅 100 个提案达到了 PASCAL VOC 2007 和 2012 检测数据集上的完全领先的召回和最先进的目标检测准确度。
Apr, 2016
该研究利用图像级别监督,通过引入两种上下文感知的模型来实现目标在图像中的定位,加性模型和对比模型有助于定位目标的位置,在 Pascal VOC2007 和 2012 测试中表现出较好的效果。
Sep, 2016
本论文提出了一种新方法,通过图像级标签,结合判别子模块覆盖问题和平滑的潜在 SVM 公式,实现仅需很少的监督,即可学习定位对象。实验表明,该方法在 PASCAL VOC 2007 检测中,相对于现有技术有 50%的平均精确度提升。
Mar, 2014