可见热微小目标检测：基准数据集和基线模型

Jun, 2024

可见热微小目标检测：基准数据集和基线模型

Visible-Thermal Tiny Object Detection: A Benchmark Dataset and Baselines

Xinyi Ying, Chao Xiao, Ruojing Li, Xu He, Boyang Li...

TL;DR本文构建了第一个大规模的多类别可见 - 热红外小目标检测（RGBT SOD）基准数据集（RGBT-Tiny），包括 115 对序列，93K 帧和 1.2M 标注，同时提出了一种适应尺度的健康度量标准（SAFit），并进行了广泛的评估。

Abstract

small object detection (SOD) has been a longstanding yet challenging task for decades, with numerous datasets and algorithms being developed. However, they mainly focus on either visible or thermal modality, while visible-thermal (→

small object detection rgbt benchmark diversity safit measure

发现论文，激发创造

RGBT 显著性目标检测：一个大规模数据集和基准

该文提出了一个名为 VT5000 的新 RGBT 图像数据集，包括 5000 个具有地面实况标注的空间对齐的 RGBT 图像对。该文介绍了一种基于多级特征和注意机制的强大基线方法，用于准确的 RGBT 显著目标检测，并在 VT5000 数据集和其他两个公共数据集上优于现有技术水平。

Jul, 2020

RGB-T 对象跟踪：基准与基线

该研究提出了一个大规模的 RGB-T 追踪视频基准数据集和一种新的基于图的方法，以学习强大的对象表示并实现多源数据融合的自适应融合，对其他最先进的追踪方法进行比较，并提供了对 RGB-T 对象追踪领域的新见解和潜在研究方向。

May, 2018

无对齐 RGBT 显著目标检测：语义引导的非对称相关网络与统一基准

通过提出一个利用语义引导的非对齐关键区域的不对称关联网络（SACNet），本文首次尝试解决未经手动对齐的 RGB 和热像对的 RGB 和 Thermal 显著目标检测（SOD）问题。使用统一的基准数据集 UVT2000，在对齐和非对齐数据集上进行了大量实验，证明了我们方法的有效性和出色的性能。

Jun, 2024

可见光与热红外无人机跟踪：一个大规模基准和新基线

本研究旨在构建一个高度多样化的可见热（RGB-T）无人机跟踪（VTUAV）基准，包括 500 个序列和 170 万帧对，以及设计了一个名为 Hierarchical Multi-modal Fusion Tracker (HMFT) 的新的 RGB-T 基准，该基准可以在各个级别上融合 RGB-T 数据。

Apr, 2022

RGB 热图显著目标检测的多交互双解码器

本文提出了一种多交互双解码器方法，挖掘和建模多类型相互作用的 RGB-thermal 显著物体检测，它能处理多种场景并具有鲁棒性。在公共 RGBT 和 RGBD SOD 数据集上进行的广泛实验表明，该方法的性能优于最先进的算法。

May, 2020

一种统一的 RGB-T 显著性检测基准：数据集，基线，分析和新方法

通过综合不同模态的输入方式，构建了一个适用于 RGB-T 图像的数据集，并提出了一种新的方法：多任务流形排序与跨模态一致性，大大提高了图像显著性检测的性能。

Jan, 2017

一体化：RGB、RGB-D 和 RGB-T 显著目标检测

提供了一个统一解决 RGB、RGB-D 和 RGB-T 三种数据类型的显著目标检测任务的创新模型框架，并基于此框架提出了一个高速高性能的轻量级 SOD 模型 AiOSOD。

Nov, 2023

ViDSOD-100: 一个新的 RGB-D 视频显著物体检测数据集和基线模型

通过收集新的注释 RGBD 视频 SOD（ViDSOD-100）数据集和提出了一种名为 ATF-Net 的新基线模型，本研究在 RGBD 视频显着目标检测方面取得了更好的性能。

Jun, 2024

基于擦除的 RGBT 视频目标检测交互网络与统一基准

RGB-thermal (RGBT) 视频目标检测是一项新的计算机视觉任务，旨在通过引入热像模态来改善在不良照明条件下由 RGB 传感器造成的性能限制。为了促进 RGBT 视频目标检测的研究和发展，本文提出了一种名为 Erasure-based Interaction Network (EINet) 的新方法，并构建了一个全面的基准数据集（VT-VOD50）用于此任务。通过利用热图像的优势，我们仅依靠较小的时间窗口来建模时空信息，从而极大地提高了效率同时保持检测准确性。

Aug, 2023

RGB-T 显著目标检测中温度因素是否始终重要？

本文提出了一个名为 TNet 的网络，通过引入全局光照估计模块，设置不同的跨模态交互机制以及两阶段本地化和补全模块，来解决 RGB-T 显著性目标检测任务。在三个数据集上进行的广泛实验证明，与 20 种最先进的方法相比，所提出的 TNet 具有竞争性的性能。

Oct, 2022