基于混合CNN-Transformer方法的实时室内目标检测

Sep, 2024

基于混合CNN-Transformer方法的实时室内目标检测

Real-Time Indoor Object Detection based on hybrid CNN-Transformer Approach

Salah Eddine Laidoudi, Madjid Maidi, Samir Otmane

TL;DR本研究解决了室内环境实时目标检测中的独特挑战，如照明变化和复杂背景，提出了一种新的数据集和改进的CNN检测模型。该模型通过引入注意力机制，显著提升了对重要特征的辨识和优先级处理能力，结果显示该方法在准确性和速度上与现有的先进模型竞争，具有重要的研究和应用潜力。

Abstract

Real-time object detection in indoor settings is a challenging area of computer vision, faced with unique obstacles such as variable lighting and complex backgrounds. This field holds significant potential to revolutionize applications like augmented and mixed realities by enabling more seamless interactions between digital content and the physical world. Ho

发现论文，激发创造

基于多区域和语义分割感知的CNN目标检测模型

本文提出一种基于卷积神经网络和语义分割的目标检测系统，利用迭代定位机制，通过高效运用模块来检测物体，并在PASCAL VOC数据集上获得了比其他方法更高的检测精度。

May, 2015

室内场景物体检测训练数据的合成

本文探讨了使用合成图像训练最先进的对象检测器，特别是针对对象实例检测。我们在实际环境的图像中将纹理对象模型的2D图像叠加在一起，以便在各种位置和比例上进行训练。通过这些实验，我们证明了利用现有的对象模型仓库为新对象训练检测器的新机会。

Feb, 2017

自主智能体的2.5/3D室内场景理解：一份综述

本文系统地总结介绍了低成本稳定的2.5/3D视觉感知器件在计算机视觉领域中如何应用于室内环境中的视觉场景理解，包括数据表示，核心技术，场景理解任务，性能评价以及面临的挑战。

Mar, 2018

室内场景目标检测的更快边界框标注

本文提出了一种快速边界框注释的方法，该方法分为两个阶段：第一步手动标注数据集的一部分，第二步采用第一阶段注释的模型对其余样本进行注释。我们还介绍了一个新的完全标记的室内场景物体检测数据集，使用几种最先进的模型对其训练，并在速度和准确性方面进行了比较。

Jul, 2018

360-Indoor: 学习在360°室内全景图像中的真实世界对象

本研究提供一个实际的室内360度全景物体检测数据集（360-Indoor），包含37个操作室内场景中常见的物体类别，每张图像平均27个包围盒。该数据集是首个用于验证360度图像上物体检测和识别的基准数据集。

Oct, 2019

室内全景图像物体识别

本文提供了一种适用于全景图像的深度学习模型，并结合目标检测和语义分割任务实现了室内场景中物体的识别与分离，进而生成定位在三维物体边界上的三维包围盒。量化和定性结果证明了我们的方法优于现有技术并且能够完整理解室内场景中的主要物体。

Oct, 2019

从THEODORE学习：用于深度迁移学习的合成全景室内顶视数据集

本文介绍一个新的大规模室内合成数据集THEODORE，包含100,000张物体的高分辨率多样化鱼眼图像，附带语义分割、实例掩模和物体检测任务的边界框注释，通过图像合成和域随机化高度泛化我们的模型，AP可达0.84

Nov, 2020

多个领域实时物体检测网络的综合研究：调查

通过在多个实时检测器及数据集上进行综合研究，本研究对图像大小、置信阈值、架构层数等多种变量的影响进行了分析，研究了检测网络在分布偏移、自然破坏和对抗攻击等方面的鲁棒性，并提出了对HTTP/3实现的区分服务（DiffServ）传输的改进。

Aug, 2022

基于对象和分割的语义特征在基于深度学习的室内场景分类中的应用

利用深度学习方法和语义信息，本文提出了一种新颖的室内场景分类方法，通过目标检测和语义分割技术获取语义信息，进一步提取基于Hu矩的分割类别形状特征，并使用全局特征、目标特征和语义分割特征构建了一个三分支网络，即GOS2F2App。在SUN RGB-D和NYU Depth V2两个基准数据集上评估了GOS2F2App，取得了最先进的结果，证明了该方法的有效性。

Apr, 2024

UniDet3D：多数据集室内三维物体检测

这项研究解决了现有室内数据集规模小且多样性不足的问题，从而影响三维物体检测模型的训练。通过统一不同的标签空间，提出了一种简单而有效的三维物体检测模型UniDet3D，该模型在多种室内环境中表现出色。实验结果表明，UniDet3D在六个室内基准测试中显著超过了现有的方法，显示出其广泛的应用潜力。

Sep, 2024