- KDD从热图的不规则序列中检测集中式太阳能发电厂的异常操作
集中式太阳能发电厂的异常检测方法研究,使用深度学习模型对高维热像数据进行特征提取,处理不规则数据、时间依赖和强烈季节性模式等问题,并采用预测模型有效地区分温度异常,实验证明了方法的有效性以及对发电厂维护提供的关键见解。
- CattleFace-RGBT: RGB-T 牛脸坐标基准
CattleFace-RGBT 数据集构建了 2300 对 RGB-T 图像,使用 AI 辅助标注工具半自动地在 RGB 图像和热像图上定位面部关键点,以实现对牛的呼吸迹象和温度的测量,旨在建立基准用于未来研究和分析比较。
- V-D-T 显著目标检测的质量感知选择融合网络
提出了一个质量感知的选择性融合网络 (QSF-Net),该网络包含三个子网络,分别是初始特征提取子网络、质量感知区域选择子网络和区域引导的选择性融合子网络。在 VDT (Visual Data Thematic) 显著对象检测任务中,通过使 - 基于视觉 Transformer 的熔池深度轮廓预测的深度学习方法
用机器学习框架将高速彩色成像下的热像与熔池横截面轮廓进行相关联,以模拟超声成像所观察到的熔池亚表面形态,并通过与实验熔池观察结果进行比较评估性能。
- 使用领域不变单元的异构人脸识别
基于预训练的人脸识别模型作为教师网络,学习领域不变的网络层,称为领域不变单元(DIU),用于减小不同模态之间的领域差距,并通过对比蒸馏框架有效地进行训练,以提高适应各种数据变化的预训练模型的性能。在多个具有挑战性的基准测试中,我们广泛评估了 - 烟雾中用专注深度度量学习解析隐藏火焰的 FlameFinder
FlameFinder 是一个深度度量学习(DML)框架,利用消防员无人机的热像图在野火监测过程中准确检测烟火,即使被烟雾遮挡。它通过使用配对的热 - RGB 图像进行训练来解决传统 RGB 相机在这种条件下的困难,并利用等效热域分布来分析 - 从双流到单流:通过互动提示学习和知识蒸馏实现高效的 RGB-T 跟踪
通过可见光图像和红外热图像的融合进行物体跟踪的 RGB-T 跟踪,通过交叉模态相互提示学习的新型两流 RGB-T 跟踪架构,将此模型作为教师指导单流学生模型,通过知识蒸馏技术实现快速学习,实验证明与类似的 RGB-T 跟踪器相比,我们设计的 - 无人机热图中使用深度学习进行目标检测
本研究提出了一种神经网络模型,能够在无人机收集的热像图中识别小型和超小型目标。模型结构包括骨干网络、中间层和预测头,其中骨干网络基于 YOLOv5 结构,结尾使用了 Transformer 编码器。中间层采用了 BI-FPN 块以及滑动窗口 - 基于 Pix2Pix GAN 的多模态人群计数
本文提出使用生成对抗网络(GANs)从彩色(RGB)图像自动生成热红外(TIR)图像,并同时使用两者训练人群计数模型以提高精确度。在多个人群计数模型和基准人群数据集上进行的实验证明了显著的精确度提升。
- LATIS:基于 λ 抽象的热像超分辨率
单幅图像超分辨率(SISR)的关键词包括:单幅图像超分辨率、基于 Transformer 的方法、lambda 抽象、热像。本文提出了一种基于 lambda 抽象的热像超分辨率新型轻量级架构(LATIS),通过局部和全局特征块(LGFB)分 - 缺陷检测中的任意分割
本研究提出了一种针对高噪声热红外图像的缺陷分割新方法 DefectSAM,通过采用广泛采用的模型 Segment Anything(SAM)和精心策划的数据集,有效地提高了缺陷检测率,尤其在复杂和不规则表面上对弱缺陷和小缺陷的检测表现出色, - 热力面部标记追踪
通过使用来自红外图像的热图像,利用人脸的重要区域进行面部标志跟踪,忽略了光照和阴影,但显示了主体的温度,通过特定位置上的热量波动反映生理变化,如血液流动和出汗,用于远程判断焦虑和兴奋。本研究进一步尝试了各种模型,包括残差连接、通道和特征关注 - 基于深度学习技术的热感人脸图像分类
这篇论文提出了一个实用的深度学习方法,用于热像分类,该方法利用卷积神经网络(CNN)架构(特别是 ResNet-50 和 VGGNet-19)从热像中提取特征,并在热输入图像上应用卡尔曼滤波进行图像去噪,实验结果证明了该方法在准确性和效率方 - 低光条件下可见光到热像转换以提高视觉任务效果
本文提出了一种利用生成网络和检测网络将 RGB 图像转化为热成像图像的端到端框架,并通过生成的热成像图像与真实数据进行比较,论证了使用生成对抗网络将 RGB 训练数据转化为热成像数据的可行性,从而加快和降低生成热成像数据的成本,满足安全应用 - 城市地区热红外长时序图像的语义分割用于热点和冷点的识别
通过分析语义分割、纵向和空间丰富的热红外图像,在城市尺度上识别热点和冷点,该研究为城市规划者提供了自动分析热红外图像的潜在应用,以制定减少城市热岛效应、提高建筑能效和最大限度地改善室外热舒适度的缓解策略。
- EANet:增强的基于属性的 RGBT 跟踪器网络
提出了一种深度学习的图像跟踪方法,将 RGB 图像和红外热像合并进行特征提取和人工属性应用的跟踪,此方法在 RGBT234 和 LasHeR 这两个最广泛使用的 RGBT 目标跟踪数据集上表现优异。
- 现有的多模态人群计数数据集可能会导致实际应用中无法实现的期望
本文探讨了多模型与单模型在人群计数方面的差异,并发现现有数据集存在热成像的偏见,提出了一个潜在数据集的标准,以回答多模型是否在人群计数方面表现更好的问题。
- TAFNet:一种针对 RGB-T 人群计数的三流自适应融合网络
本文提出了一个名为 TAFNet 的三流自适应融合网络,使用配对的 RGB 和热像图进行人群计数,实验结果在 RGBT-CC 数据集上表现出超过 20%的改进。
- 基于空间上下文深度网络的自动驾驶多模态行人检测
本文提出一种基于 RGB 和热图像的、具有新颖空间上下文深度网络结构和多模态特征嵌入模块的行人检测端到端多模态融合模型,其能够在真实世界的日夜低光照条件下实现高效而准确的检测。
- CVPR利用显著性地图进行热像中的行人检测
利用润色图确保在昼间的热成像图像上提高行人检测效果,并在 KAIST 多光谱行人检测数据集的子集上提供像素级行人掩模。