构建多功能行人知识库实现鲁棒性行人检测
本文利用卷积网络模型,采用多阶特征提取,全局形状信息和本地独特的纹理信息相结合以及基于卷积稀疏编码的无监督方法来预训练过滤器,取得了所有主要行人数据集上的最先进和有竞争力的结果,从而解决了行人检测的实际问题。
Dec, 2012
本篇论文提出一个基于深度学习的行人检测系统,通过分析和优化检测流程的每一步,我们提出了一种优于传统方法的架构,在保持低计算时间情况下实现了接近先进方法的任务准确性,并在 NVIDIA Jetson TK1 上测试了该系统。
Oct, 2015
通过将大型语言模型与视觉线索相结合,我们提出一种新的方法来理解语境外观变化并将其知识应用于行人检测任务,通过与大量描述行人外观的叙述语料库结合,提取代表外观变化的知识集合,并通过任务驱动的过程获得与行人检测相关的外观知识单元,最终实现与视觉线索的融合,从而提供丰富的外观信息,并验证了该方法的有效性。
Nov, 2023
本论文介绍了一个利用自动提取的场景上下文信息的多摄像头全局组合行人检测方法,通过语义分割技术获得上下文信息用于自动生成场景的共同区域,从而获取一系列的联合检测框。相比其他同类方法,本文提出的方法具有场景无关性和实现的快速性,且在五个公共数据集上验证具有更好的性能。
Dec, 2018
本文基于变分推理的视角,利用自编码变分贝叶斯算法提出了一种高效的行人检测算法,将密集检测框作为潜在变量,提高了现有基于交并比的器检测方法在人群密集情况下的效率。实验证明:该算法可用于单阶段检测器,同时也能提高双阶段检测器性能表现。
Apr, 2021
本研究提出了一种新的层次化知识蒸馏框架,以学习轻量级行人检测器,该方法可以显著降低计算成本并同时保持高精度。实验结果表明,使用我们的框架训练的学生模型,在参数数量压缩了 6 倍的情况下,仍然可以在广泛使用的行人检测基准上实现与老师模型相当的性能。
Sep, 2019
提出了一种多相机 3D 行人检测方法,该方法不需要使用目标场景的数据进行训练,通过基于人体姿势和来自现成单目检测器的人物包围框的新启发式方法在地面平面上估计行人位置,然后将这些位置投影到世界地面平面,并用新的团覆盖问题公式进行融合,同时还提出利用域通用的行人再识别模型在融合期间对行人外貌的选择性步骤,评估表明,在具有挑战性的 WILDTRACK 数据集上,所提出的方法获得了 0.569 的 MODA 和 0.78 的 F 分数,优于现有的最先进的通用检测技术。
Apr, 2021