基于混合CNN-Transformer方法的实时室内目标检测
本文提出一种基于卷积神经网络和语义分割的目标检测系统,利用迭代定位机制,通过高效运用模块来检测物体,并在PASCAL VOC数据集上获得了比其他方法更高的检测精度。
May, 2015
本文探讨了使用合成图像训练最先进的对象检测器,特别是针对对象实例检测。我们在实际环境的图像中将纹理对象模型的2D图像叠加在一起,以便在各种位置和比例上进行训练。通过这些实验,我们证明了利用现有的对象模型仓库为新对象训练检测器的新机会。
Feb, 2017
本文系统地总结介绍了低成本稳定的2.5/3D视觉感知器件在计算机视觉领域中如何应用于室内环境中的视觉场景理解,包括数据表示,核心技术,场景理解任务,性能评价以及面临的挑战。
Mar, 2018
本文提出了一种快速边界框注释的方法,该方法分为两个阶段:第一步手动标注数据集的一部分,第二步采用第一阶段注释的模型对其余样本进行注释。我们还介绍了一个新的完全标记的室内场景物体检测数据集,使用几种最先进的模型对其训练,并在速度和准确性方面进行了比较。
Jul, 2018
本研究提供一个实际的室内360度全景物体检测数据集(360-Indoor),包含37个操作室内场景中常见的物体类别,每张图像平均27个包围盒。该数据集是首个用于验证360度图像上物体检测和识别的基准数据集。
Oct, 2019
本文提供了一种适用于全景图像的深度学习模型,并结合目标检测和语义分割任务实现了室内场景中物体的识别与分离,进而生成定位在三维物体边界上的三维包围盒。量化和定性结果证明了我们的方法优于现有技术并且能够完整理解室内场景中的主要物体。
Oct, 2019
本文介绍一个新的大规模室内合成数据集THEODORE,包含100,000张物体的高分辨率多样化鱼眼图像,附带语义分割、实例掩模和物体检测任务的边界框注释,通过图像合成和域随机化高度泛化我们的模型,AP可达0.84
Nov, 2020
通过在多个实时检测器及数据集上进行综合研究,本研究对图像大小、置信阈值、架构层数等多种变量的影响进行了分析,研究了检测网络在分布偏移、自然破坏和对抗攻击等方面的鲁棒性,并提出了对HTTP/3实现的区分服务(DiffServ)传输的改进。
Aug, 2022
利用深度学习方法和语义信息,本文提出了一种新颖的室内场景分类方法,通过目标检测和语义分割技术获取语义信息,进一步提取基于Hu矩的分割类别形状特征,并使用全局特征、目标特征和语义分割特征构建了一个三分支网络,即GOS2F2App。在SUN RGB-D和NYU Depth V2两个基准数据集上评估了GOS2F2App,取得了最先进的结果,证明了该方法的有效性。
Apr, 2024
这项研究解决了现有室内数据集规模小且多样性不足的问题,从而影响三维物体检测模型的训练。通过统一不同的标签空间,提出了一种简单而有效的三维物体检测模型UniDet3D,该模型在多种室内环境中表现出色。实验结果表明,UniDet3D在六个室内基准测试中显著超过了现有的方法,显示出其广泛的应用潜力。
Sep, 2024