学习跨模态深度表示以实现鲁棒的行人检测
本文提出一种基于多任务学习的多光谱行人检测框架,利用新颖的感知权重机制、带 illumination-aware 的深层卷积神经网络等技术,提高了检测和语义分割的性能。实验结果表明,该方法在 KAIST 多光谱行人数据集上性能超过了现有的最先进方法。
Feb, 2018
本文提出一种基于 RGB 和热图像的、具有新颖空间上下文深度网络结构和多模态特征嵌入模块的行人检测端到端多模态融合模型,其能够在真实世界的日夜低光照条件下实现高效而准确的检测。
May, 2021
该研究深入比较了六种不同的卷积网络融合架构,并分析了它们的适应性,从而使传统架构能够实现与最先进的结果可比的检测性能。然后,提出了一种感知光照的 Faster R-CNN,该方法采用适应性门控函数来整合彩色和热图像,实现了对行人的有效检测,并在 KAIST 多光谱行人基准上获得了验证。
Mar, 2018
本论文通过对 Faster R-CNN 进行多光谱行人检测任务的深入分析,并将其建模为卷积神经网络(ConvNet)融合问题,同时发现使用彩色和热成像图像训练的基于 ConvNet 的行人检测器在区分人类实例方面提供了互补信息,其在 KAIST 行人基准上的实验结果表明,在不同 DNN 阶段集成两个分支 ConvNets 的四种 ConvNet 融合结构中,半路融合模型在中间级卷积特征上的结合优于基线方法 11%,遗漏率比其他建议的架构低 3.5%。
Nov, 2016
本文提出了一种新型的对齐区域卷积神经网络 (AR-CNN),通过区域特征对齐,多模态融合和 RoI 抖动等方式处理颜色 - 热图图像不完全对齐的问题,实现多光谱行人检测,并提出了新型的 bounding box 标记方法。
Jan, 2019
通过提出跨模态提案引导特征挖掘机制和双流密集检测器,本研究解决了 RGB-T 行人检测中由于未对齐图像对导致的跨模态互补和未对齐行人的识别等问题,并通过数据增强方法和非极大值抑制方法进一步提高了方法的有效性和鲁棒性。
Aug, 2023
本研究针对光照不足条件下的多光谱行人检测,提出了一种融合网络架构,包括多光谱提议网络和多光谱分类网络。该网络通过同时优化行人检测和语义分割任务进行学习,并通过整合不同模式和两个阶段的输出来获得最终的检测结果,在 KAIST 数据集上显著优于现有方法。此外,作者也提供了一个经过消毒的 KAIST 数据集训练标注,帮助解决不同种类标注错误的问题。
Aug, 2018
本研究提出了一种名为 MBNet 的多光谱行人检测模型,利用 Differential Modality Aware Fusion 模块以及光照感知特征对多种模态进行融合,在 KAIST 和 CVC-14 数据集上均取得了领先于现有模型的准确性与计算效率。
Aug, 2020