基于自监督学习的大规模负样本合成技术在红外小目标检测中的应用
本文提出了一种新方法,使用单点监督来缓解红外小目标检测中昂贵训练数据的注释负担,并通过引入聚类方法的随机性和 “蒙特卡罗” 聚类方法来精确恢复拟似掩码,从而将任意完全监督的小目标检测网络转变为仅具有单点注释的弱监督网络。实验证明,该方法可以达到与完全监督网络相当的性能,揭示了单点监督的强大性。
Apr, 2023
本文提出了一种用于红外小目标检测的扩散模型框架,通过模拟像素级判别与掩模后验分布建模相结合,转变了从判别范式到生成范式的方法,以绕过目标级的不敏感性,并设计了小波域中的低频隔离以抑制内在红外噪声对扩散噪声估计的干扰。实验证明,该方法在 NUAA-SIRST、IRSTD-1k 和 NUDT-SIRST 数据集上相对于最先进的方法具有竞争性的性能优势。
Mar, 2024
提出了一种基于改进的稠密嵌套注意力网络(IDNANet)的红外小目标检测方法,采用变压器架构并结合 Swine-transformer 进行特征提取,在稠密嵌套结构中引入 ACmix 注意力结构增强中间层特征,通过设计加权 Dice 二元交叉熵(WD-BCE)损失函数缓解前景 - 背景样本不平衡的负面影响。通过在公共数据集上的实验表明,该方法在检测概率(P_d)、误警率(F_a)和平均交集联合($mIoU$)等指标上优于其他最先进的方法,NUDT-SIRST 数据集上的 $mIoU$ 为 90.89,NUAA-SIRST 数据集上为 79.72。
Nov, 2023
本文提出了一个利用深度学习和数据增强的热红外(TIR)远程目标检测系统,该系统针对海上救援进行研究。通过使用 TIR 相机(FLIR)建立了一个自采集的 TIR 数据集,其中包括多个模拟人类救援情境的场景。此外,为了解决数据集稀缺和改善模型的鲁棒性,还收集了一个合成数据集,该数据集是从一个 3D 游戏(ARMA3)中获取的。然而,合成 TIR 图像与真实 TIR 图像之间存在显著的领域差距。因此,为了解决这个问题,本文建议了一种基于生成模型的从 3D 游戏到真实情况下的目标 - 背景分离领域自适应算法。此外,还提出了一个带有固定权重内核的分割网络,以改善信噪比(SNR)并提供弱注意力,因为远程 TIR 目标本质上具有不清晰的边界。实验结果表明,用包含翻译合成和真实 TIR 数据的增强数据训练的网络在性能上明显优于只使用真实 TIR 数据进行训练的网络。此外,所提出的分割模型超越了最先进的分割方法的性能。
Oct, 2023
使用图像到图像翻译模型,将可得的 RGB 数据转换成合成 TIR 数据用于 TIR 跟踪中的端到端特征的训练,并在 VOT-TIR2017 数据集上进行实验,发现相对于仅训练可得真实 TIR 数据或人工构建特征的方法,使用合成数据进行训练可以显著提高跟踪性能且通过与运动特征的结合可以进一步改进。
Jun, 2018
这篇论文提出了一种劳动效率高且粗略标注框架,通过使用级数集来获得仅需一次粗略点击即可得到高质量伪掩码,解决了因小目标尺寸和过度正则化导致的零水平轮廓消失的问题,实验表明该方法在 NUAA-SIRST 和 IRSTD-1k 数据集上具有优异的性能。
Oct, 2023
本文提出了一种多流密集嵌套网络 iSmallNet,配合标签解耦技术针对红外小目标检测中常见的背景杂乱、易错报和 CNN 无法识别等问题,在内部地图和边界地图上解决源标签分布不均的问题,并引入多尺度嵌套交互模块和内部 - 边界融合模块以增强整个网络的性能,实验结果表明 iSmallNet 比其他 11 种最先进的检测器表现更好。
Oct, 2022
该研究提出了一种可见光与近红外图像融合的方法,通过使用 RGBT 传感器获取的可见图像和近红外通道的信息,利用 SSIM 损失和边缘保护等技术进行融合,并在实验证明相比其他方法,该方法在多光谱融合方面取得了更好的结果。
Jul, 2023
提出了一种基于空间通道交叉变换器网络(SCTransNet)的红外小目标检测方法,利用跨通道变换器块(SCTBs)以及长程跳跃连接来加强目标和背景之间的语义差异,有效地检测小尺度的红外目标。
Jan, 2024
提出了一种使用生成对抗网络的无监督学习方法,来实现热红外相机拍摄图像的可视化处理,相较于现有的监督学习模型,该模型在 KAIST-MS 数据集上表现更好,并且对新环境具有良好的泛化性能。
Apr, 2019