MMDetection: 开源 MMLab 检测工具箱和基准
MMOCR 是一个开源工具箱,提供了文本检测和识别的全面流水线,以及其下游任务,例如命名实体识别和关键信息提取。它实现了 14 种最先进的算法,大大超过了我们目前知道的所有现有开源 OCR 项目。
Aug, 2021
在自动驾驶领域,精确分割 LiDAR 数据对于理解复杂的 3D 环境至关重要。为了解决传统方法中零散、独立的代码库的问题,以及统一推进和公平比较模型的问题,我们引入了 MMDetection3D-lidarseg。作为一种综合性工具箱,它旨在高效地训练和评估最先进的 LiDAR 分割模型。我们支持广泛的分割模型,并集成先进的数据增强技术以增强鲁棒性和泛化性。此外,该工具箱还为多个主流稀疏卷积后端提供支持,以优化计算效率和性能。通过建立统一框架,MMDetection3D-lidarseg 简化了开发和评估,并为研究和应用设定了新的标准。我们在广泛使用的数据集上进行了大量基准实验,证明了该工具箱的有效性。已公开提供代码库和训练模型,以促进自动驾驶 LiDAR 分割领域的进一步研究和创新。
May, 2024
本研究旨在检验实时目标检测模型的可重复性和基准测试。通过比较大量的目标检测模型在多个显卡上的精度和推理速度,我们还重现了 DETR、RTMDet、ViTDet 和 YOLOv7 等模型,并提出了一个统一的训练和评估流程,以更好地比较模型。然而,我们发现某些模型在准确性和速度上无法达到原始论文所述性能,而 RTMDet 和 YOLOv7 可以匹配这些性能。总的来说,结果显示准确性和速度之间存在着明显的权衡,其中以无锚点模型(尤其是 RTMDet 或 YOLOx 模型)为主。
May, 2024
本文介绍了一个新型的大规模基准数据集 BigDetection,它通过整合多个现有数据集并提供更大样本数量、更统一的标注体系,可以用于改进物体检测算法的预训练效果,并已被证明是一个有效的检测方法评估标准。
Mar, 2022
本文介绍了一种新的方法 Max-Margin Object Detection(MMOD)用于在图像中学习检测物体,该方法不进行子采样,而是优化所有子窗口,并且可以用于改进任何线性学习参数的物体检测方法,本文证明了该方法在三个公开数据集上具有显著的性能优势,并且在 MMOD 的学习下,单个刚性 HOG 滤波器可以比可变形部件模型在人脸检测数据集和基准测试中表现更好。
Jan, 2015
本文主要介绍了利用密度估计方法对目标边框进行多目标检测的过程,并提出了一种新的基于密度估计的模型 Mixture Density Object Detector (MDOD) 来应对此问题并有效提高检测性能。
Nov, 2019
本文提出了一种基于 MQTT 协议的轻量级接口框架,可用于测量目标检测性能、运行时间和能量效率,特别适用于限制硬件上的视频流应用,为优化 DNNs 提供深入的见解。
Apr, 2023
该研究提出了一种名为 SSD 的方法,使用单个深度神经网络在图像中检测对象,在特征映射位置上将边界框的输出空间离散化为一组具有不同宽高比和尺度的默认框,利用不同分辨率的多个特征图进行预测,并结合了对象分类的得分和对每个初始框进行微调。该方法相对于其他需要对象提议的方法来说更为简化并具有相当准确性。
Dec, 2015
本文提出了一种新的大批量目标检测器(MegDet),通过一种学习率政策和交叉 GPU 批量归一化措施,可以显著缩短培训时间(例如从 33 小时到 4 小时)并提高准确性(按标准 COCO 数据集评估,mmAP 为 52.5%),从而比以前快训练更大的小批量大小(例如,从 16 到 256 个)。
Nov, 2017
本文概述了基于深度学习的物体检测器的最新发展,提供了检测中使用的基准数据集和评估指标的简明概述,以及在识别任务中使用的一些主要骨干架构和现代轻量级分类模型,最后我们比较了这些架构在多个度量标准上的性能。
Apr, 2021