Cycle-YOLO: 一种高效稳健的路面损害检测框架
本研究提出了 YOLO9tr,一种基于深度学习的新型轻量级目标检测模型,用于道路损坏检测,其在特征提取和注意力机制方面引入了部分注意力块,以提高在复杂情况下的检测性能,并通过多国的道路损坏图像数据集进行训练,扩展了损坏分类范围,并与 YOLO8、YOLO9 和 YOLO10 等先进模型相比具有更高的精度和推断速度,达到高达 136FPS 的帧率,适用于实时应用,该研究进一步验证了部分注意力块的有效性,突出了 YOLO9tr 在实时道路状况监测中的潜力,为维护安全和功能良好的道路基础设施提供了稳健和高效的解决方案。
Jun, 2024
提出了一种基于 DenseNet 块和 CBAM 的实时深度学习伤害检测模型,采用先进的自我注意机制实现多尺度目标检测,并减少计算复杂度,结果显示该模型性能优于当前最先进模型,是准确和鲁棒的机器人在现实场景下实现自动化损坏检测系统的重要一步。
Mar, 2023
本研究提出了使用 You Only Look Once (YOLO) 版本五(YOLOv5)和版本八(YOLOv8)算法来检测和分类道路路面裂缝的方法。实验结果表明,在不同照明条件和图像尺寸下,路面裂缝的检测精度可达 67.3%。该研究的发现可以帮助公路管理机构准确地检测和分类不同照明条件下的资产状况,减少人工检查的成本和时间,极大地降低公路资产维护的成本。
Jun, 2024
提出一种通过超分辨率生成对抗网络 (SRGAN) 使用低分辨率相机或图像和视频流进行自动坑洞检测的算法,并使用 You Only Look Once (YOLO) 网络在低质量和高质量的车载摄像头图像上建立基线坑洞检测性能,然后通过图像增强的方式提高速度和准确性。
Nov, 2023
在道路基础设施维护和保障道路安全中,有效检测道路危险是至关重要的。本研究评估了 YOLOv8,一种物体检测模型,在检测路面危险,如坑洞、下水道盖和人孔等方面的综合性能。通过与之前版本 YOLOv5 和 YOLOv7 的比较分析,强调了计算效率在各种应用中的重要性。本文探讨了 YOLOv8 的架构,并探索了旨在提高检测准确性的图像预处理技术,包括光照、道路类型、危险大小和类型的多样条件。此外,通过调整学习率、批量大小、锚点框大小和增强策略进行超参数调优实验,优化模型的性能。模型评估基于 Mean Average Precision (mAP),这是一种广泛接受的物体检测性能指标。通过在多种测试场景下计算 mAP 分数,本研究评估了模型的稳健性和泛化能力,强调了 YOLOv8 在道路危险检测和基础设施维护中的重要性。
Oct, 2023
我们提出了基于 YOLOv5s 的改进目标检测方法 MFL-YOLO(互补特征级别损失增强 YOLO),通过设计简单的跨级别损失函数,使得模型的每个级别都具有自己的作用,有助于学习更多多样化的特征并提高细粒度。相比 YOLOv5s,我们的 MFL-YOLO 在 F1 得分和 mAP 上分别提高了 4.3 和 5.1,同时减少了 8.9% 的 FLOPs。Grad-CAM 热图可视化显示我们的模型能更好地关注损坏交通标志的局部细节。此外,我们还对 CCTSDB2021 和 TT100K 进行了实验证明我们模型的泛化性。
Sep, 2023
这篇研究论文介绍了一种使用深度学习和图像处理技术进行坑洼检测的新方法,提出的系统利用 VGG16 模型进行特征提取,并采用自定义的具有三重损失的 Siamese 网络(称为 RoadScan),以解决道路上的坑洼问题对道路使用者的重大风险。
Aug, 2023
本文研究并实施了流行的对抗性攻击,对 YOLOv5 目标检测算法进行了调查。研究探讨了在交通和道路标志检测的背景下,不同类型的攻击(包括 L-BFGS、FGSM、C&W,BIM,PGD,One Pixel,和通用对抗扰动攻击)对 YOLOv5 检测准确率的影响。结果表明,YOLOv5 容易受到这些攻击的影响,误分类的率随着扰动幅度的增加而增加。此外,本文使用显著性图解释了结果。该研究的发现对交通和运输系统中用于目标检测的算法的安全和可靠性具有重要的意义,强调了需要更加健壮和安全的模型以确保其在实际应用中的有效性。
May, 2023
本文使用了改进的 YOLOv5 和 YOLOv8 模型,在不同照明条件下检测和分类不同的道路标志,实验结果表明,两个模型在不同训练设置下都能表现良好,其中 YOLOv8 模型的 MAP50 得分略高。这些发现为寻求可靠且适应性强的物体检测应用方案的从业人员提供了宝贵的见解。
Jun, 2024
本文针对 Advanced Driver-Assistance Systems (ADAS) 中行人检测的挑战,使用 YOLOv5s 框架在 Caltech 行人数据集上进行 fine-tune,并且开发了可用于准备数据和注释数据的工具箱。实验结果表明,使用作者提出的方法,行人检测任务的均值平均精度(mAP)可高达 91%,且最高帧率可达 70 FPS,是一种比其他现有技术更为有效和准确的方法。
Oct, 2022