可见热微小目标检测:基准数据集和基线模型
该文提出了一个名为 VT5000 的新 RGBT 图像数据集,包括 5000 个具有地面实况标注的空间对齐的 RGBT 图像对。 该文介绍了一种基于多级特征和注意机制的强大基线方法,用于准确的 RGBT 显著目标检测,并在 VT5000 数据集和其他两个公共数据集上优于现有技术水平。
Jul, 2020
该研究提出了一个大规模的 RGB-T 追踪视频基准数据集和一种新的基于图的方法,以学习强大的对象表示并实现多源数据融合的自适应融合,对其他最先进的追踪方法进行比较,并提供了对 RGB-T 对象追踪领域的新见解和潜在研究方向。
May, 2018
通过提出一个利用语义引导的非对齐关键区域的不对称关联网络(SACNet),本文首次尝试解决未经手动对齐的 RGB 和热像对的 RGB 和 Thermal 显著目标检测(SOD)问题。使用统一的基准数据集 UVT2000,在对齐和非对齐数据集上进行了大量实验,证明了我们方法的有效性和出色的性能。
Jun, 2024
本研究旨在构建一个高度多样化的可见热(RGB-T)无人机跟踪(VTUAV)基准,包括 500 个序列和 170 万帧对,以及设计了一个名为 Hierarchical Multi-modal Fusion Tracker (HMFT) 的新的 RGB-T 基准,该基准可以在各个级别上融合 RGB-T 数据。
Apr, 2022
本文提出了一种多交互双解码器方法,挖掘和建模多类型相互作用的 RGB-thermal 显著物体检测,它能处理多种场景并具有鲁棒性。在公共 RGBT 和 RGBD SOD 数据集上进行的广泛实验表明,该方法的性能优于最先进的算法。
May, 2020
通过综合不同模态的输入方式,构建了一个适用于 RGB-T 图像的数据集,并提出了一种新的方法:多任务流形排序与跨模态一致性,大大提高了图像显著性检测的性能。
Jan, 2017
提供了一个统一解决 RGB、RGB-D 和 RGB-T 三种数据类型的显著目标检测任务的创新模型框架,并基于此框架提出了一个高速高性能的轻量级 SOD 模型 AiOSOD。
Nov, 2023
通过收集新的注释 RGBD 视频 SOD(ViDSOD-100)数据集和提出了一种名为 ATF-Net 的新基线模型,本研究在 RGBD 视频显着目标检测方面取得了更好的性能。
Jun, 2024
RGB-thermal (RGBT) 视频目标检测是一项新的计算机视觉任务,旨在通过引入热像模态来改善在不良照明条件下由 RGB 传感器造成的性能限制。为了促进 RGBT 视频目标检测的研究和发展,本文提出了一种名为 Erasure-based Interaction Network (EINet) 的新方法,并构建了一个全面的基准数据集(VT-VOD50)用于此任务。通过利用热图像的优势,我们仅依靠较小的时间窗口来建模时空信息,从而极大地提高了效率同时保持检测准确性。
Aug, 2023
本文提出了一个名为 TNet 的网络,通过引入全局光照估计模块,设置不同的跨模态交互机制以及两阶段本地化和补全模块,来解决 RGB-T 显著性目标检测任务。在三个数据集上进行的广泛实验证明,与 20 种最先进的方法相比,所提出的 TNet 具有竞争性的性能。
Oct, 2022