准确物体检测与语义分割的丰富特征层次结构
本文研究使用语义丰富的图像和深度特征进行RGB-D图像目标检测问题。我们提出了一种新的地心嵌入深度图像的方法,该方法编码了每个像素相对于地面的高度和重力角度,以及水平视差。我们证明了这种地心嵌入方法比使用原始深度图像更适用于使用卷积神经网络进行特征表示学习。最后,我们使用对象检测器的输出在现有的超像素分类框架中进行语义场景分割,并在我们研究的对象类别中实现了24%的相对改进。
Jul, 2014
该研究证明,卷积网络可以通过端到端的训练,从像素到像素地训练,超越先前的语义分割最先进方法,通过自适应大小输入和高效学习来生成相应大小的输出。该研究还详细介绍了全卷积网络的应用于空间密集预测任务,并将 AlexNet、VGG 网和 GoogLeNet 等现代分类网络改进成全卷积网络,并将它们学习到的表示通过微调应用于语义分割任务。最后,该研究提出了一种新的网络架构,将深层次粗糙层和浅层外观信息相结合以生成准确和详细的分割结果,在 PASCAL VOC、NYUDv2 和 SIFT Flow 数据集上实现了最先进的语义分割(2012年的mean IU相较前一方法提高20%),对典型图像的推理时间仅需三分之一秒。
Nov, 2014
该研究论文结合深度卷积神经网络和概率图模型的方法来解决像素级分类(语义图像分割)任务中深层网络往往无法精确定位目标分割的问题,并通过将深层网络的响应与全连接条件随机场相结合,提出了一种 DeepLab 系统。定量实验表明,该方法在 PASCAL VOC-2012 语义图像分割任务中,IOU 精度可达 71.6%。
Dec, 2014
本论文探讨了如何使用共享的、独立于区域的卷积特征构建区域分类器网络,并发现深度和卷积的区域分类器对于物体检测特别重要,而最新的图像分类模型则不会直接导致良好的检测准确性,我们通过实验证明,尽管ResNets和Faster R-CNN系统是有效的,但NoCs的设计对于ImageNet和MS COCO 2015挑战赛的第一名入选至关重要。
Apr, 2015
本文提出一种基于卷积神经网络和语义分割的目标检测系统,利用迭代定位机制,通过高效运用模块来检测物体,并在PASCAL VOC数据集上获得了比其他方法更高的检测精度。
May, 2015
本文提出了一种基于卷积神经网络的Fully Convolutional Networks(FCN)方法,可以用于图像的深度语义分割。通过该方法,我们成功地提高了 PASCAL VOC、NYUDv2、SIFT Flow 和 PASCAL-Context 等公开数据集上的 segmentation 模型的性能,并且推断速度远快于之前的相关工作。
May, 2016
本论文涉及基于区域的检测器,使用卷积网络实现高效的物体检测,使用位置敏感的得分图解决分类中的平移不变性和物体检测中的平移可变性的问题,可自然地采用全卷积图像分类器骨干网进行物体检测,以101层残差网络(ResNet)在PASCAL VOC数据集上取得83.6%mAP的竞争性结果,测试时间为每张图像170ms,比Faster R-CNN快2.5-20倍。
May, 2016
本文提出一种基于展开潜在结构的模型可解释性解释方法并以物体检测为案例运用了有向无环图模型探索ROI区域中潜在的部件结构并自动生成部件组合,最后在PASCAL VOC 2007和2012数据集上进行验证,结果表明其方法能够不影响性能的情况下展现有希望的潜在结构。
Nov, 2017
本文利用深度学习网络结构,使用单个深度图像为输入,实现了语义分割中对可见和遮挡物体及其部分的类型预测,将语义类别进一步细分为背景和多个前景物体组,并改进了标准的交叉熵损失函数以适应这种情况,实验证明所提出的分类方法能够验证预测出被遮挡物体部分的语义类别,无需增加网络结构规模,其性能在由SUNCG数据集生成的新数据集上得到验证。
Jun, 2019
本书探讨目标检测与语义分割的理论基础与实际应用,填补了传统方法与现代深度学习框架之间的空白。书中介绍了卷积神经网络、YOLO架构和基于变换器的方法等先进技术,强调了人工智能与大语言模型在复杂环境中的目标检测中的集成。通过对大数据分析的深入讨论,展示了数据处理、模型优化和性能评估的重要性。
Oct, 2024