- 高分辨率事件相机行人检测
本文研究使用事件相机结合深度学习进行行人检测任务,并比较了不同处理方法的效果,结果表明事件相机是解决现有问题的潜在技术。
- TFDet: RGB-T 行人检测的目标感知融合
本文提出了一种名为 TFDet 的新型多光谱行人检测方法,采用目标感知融合策略和相关最大化损失函数来增强地面行人特征,有效地解决了在低光条件下行人检测不准确的问题,并在两项基准测试中达到了 state-of-the-art 的性能。
- 亮通道先验关注多光谱行人检测
提出了一种新方法 “亮通道先验关注”,通过集成图像增强和检测,将可见光图像的无监督自编码器与热像图像的 HSV 图像的 V 通道作为注意图触发,逐渐强调行人特征,以改善低光条件下的行人检测,包括自注意力增强模块和检测模块,通过强化网络生成更 - 扩散式数据集生成:缩小行人检测 Sim2Real 差距的步伐
该研究提出了一种使用扩散模型增强模拟数据集的方法,以改善行人检测在现实世界数据中的性能,并使用扩散基础架构来生成具有真实分布的数据集,以填补模拟数据和真实数据之间的差距,通过使用生成数据与模拟数据进行的训练可以将行人检测模型在真实数据中的平 - CVPRt-RAIN: 天气模糊标签转移攻击下的稳健泛化
通过分析标签偏移对自动驾驶中的多气候分类任务及行人检测任务的影响,并提出使用 t-RAIN 进行数据增广的方法,使得在无偏移、雾、雪和尘埃偏移情形下行人检测的性能提高 2.1%-4.4%,在真实和合成气象领域中分别获得最优的 82.69 A - CARLA-BSP: 一个包含行人的模拟数据集
使用 ARCANE 框架在 CARLA (0.9.13) 中生成的自由行人数据集,用于行人检测,自编码,姿势估计和姿势提升,并展示了基准结果。
- 欺骗物理世界中的热红外探测器
本研究提出了一种基于对抗性红外块的物理攻击方法,该方法可以从不同的角度对热成像系统进行黑盒攻击,成功率高达 80%以上,并以衣服内部的方式增强其潜行性。同时,本研究对先进探测器进行了测试,并证明了该方法的鲁棒性和实用性。
- 聚集场景中通过头部聚焦处理高度遮挡问题的密集人群跟踪
本研究中,我们提出了一种联合检测深度学习模型,用于解决在高密度人群中识别和跟踪行人的问题,实验数据表明,该模型在小型和中型行人检测方面取得了最先进的结果。
- CVPRVLPD: 通过视觉语义自监督实现上下文感知的行人检测
本论文提出了一种基于视觉语言自监督学习的上下文感知行人检测方法 (VLPD),采用自生成的显式语义类标签来学习语义分割和行人检测任务,并提出了自我监督原形语义对比学习方法来更好地判别行人和其他分类,并在流行的基准数据集上进行了广泛的实验,证 - 低光视觉中的行人检测
项目中,我们通过图像融合技术对数据集进行预处理,然后使用 Vision Transformer 模型从融合图像中检测行人。在评估过程中,我们将比较 YOLOv5 和改进后的 ViT 模型在融合图像上的性能。
- 重新审视多模式行人检测中的模态不平衡
本文介绍一种解决多模态学习中偏向某一模态的训练分布不平衡问题的新方法,使用正则化训练多模态架构使特征提取器在训练期间被同等看待以提取多模态分布,结果表明该方法在 KAIST 和 UTokyo 数据集上显着提高了最先进的性能。
- 通过并行边缘卸载在拥挤场景中实时高分辨率行人检测
Hode 是一个视频分析框架,使用分布式 edge 节点加速行人检测,具有上下文感知区域分割和基于 DRL 的调度算法,可以在减少精度损失的同时实现高达 2.01%的加速效果。
- 用于遮挡行人检测的特征校准网络
本文介绍了一种基于深度学习框架的新型特征学习方法 - 特征校准网络 (FC-Net),该方法能够自适应检测含有多种遮挡情况的行人。作者通过引入自激活模块和特征校准模块,在学习特征时能够突出行人可见部分,压制遮挡部分。实验结果表明,在 Cit - Beta R-CNN:从另一角度审视行人检测
该研究提出了一种基于 2D beta 分布的新颖表示方法,即 Beta Representation,它通过显式构建全身和可见框之间的关系,并通过给像素分配不同的概率值来强调中心可视质心,从而在拥挤场景中区分高度重叠的实例,进而提高行人检测 - 自动驾驶车辆的稳健行人检测方法
本文针对 Advanced Driver-Assistance Systems (ADAS) 中行人检测的挑战,使用 YOLOv5s 框架在 Caltech 行人数据集上进行 fine-tune,并且开发了可用于准备数据和注释数据的工具箱。 - ECCV领域自适应人员搜索
本文提出了一种基于领域自适应的人员搜索模型 (DAPS),该模型通过设计一种新的领域自适应模块,最小化领域偏差,并结合伪边界框及动态聚类策略,帮助模型在未标记目标域中训练人员检索任务,实现了相对于现有方法更高的性能。
- CVPR多角度实现红外线隐身:在现实世界中躲避红外线探测器
本文提出了一种基于红外对抗技术的服装设计方法,设计出一种反可见光的 QR 码图案,制造出一件防检测衣服,在数字世界和物理世界的实验中,分别测试了适用性和迁移性。
- CVPRSTCrowd: 拥挤场景中行人感知的多模态数据集
为了更好地评估拥挤场景下的行人感知算法,我们引入了一个大规模多模态数据集 STCrowd,并提出了一种新的方法 DHA 来增强拥挤场景中的行人感知。实验表明,我们的方法在各种数据集上均取得了最先进的性能。
- 利用稀疏变换器的单步 3D 物体检测器
本文研究在自动驾驶中基于 LiDAR 的三维物体检测问题,发现传统的下采样操作可能对信息造成不可避免的损失,提出了一种称作 Single-stride Sparse Transformer (SST) 的新方法,该方法利用 transfor - 示例引导的对比学习用于行人检测
本研究提出了一种基于对比学习的方法,将代表行人外观的先验知识转化为示例字典,通过最小化不同外貌之间的语义距离来消除外观多样性,从而有效地检测行人。