3 秒钟前发生了什么？热成像推断过去

Apr, 2023

3 秒钟前发生了什么？热成像推断过去

What Happened 3 Seconds Ago? Inferring the Past with Thermal Imaging

Zitian Tang, Wenjie Ye, Wei-Chiu Ma, Hang Zhao

TL;DR该研究开发了一个三阶段的神经网络模型，利用 RGB - 热成像数据集进行过去的人体姿势估计，并表明热信号可显著降低该任务的不确定性。

Abstract

Inferring past human motion from RGB images is challenging due to the inherent uncertainty of the prediction problem. Thermal images, on the other hand, encode traces of past human-object interactions left in the environment via thermal radiation measurement. Based on this observation, we collect the first →

rgb-thermal dataset human motion analysis neural network model thermal cues pose estimation

发现论文，激发创造

LWIRPOSE：一种新型 LWIR 热图像数据集和基准

通过建立一个拥有 2,400 张高质量 LWIR（热力红外）图像的独特 RGB - 热力几乎配对和注释的 2D 动作数据集，该研究论文介绍了一个有助于遮挡和其他挑战情景中动作估计的数据集，并对数据集上的先进动作估计方法进行了基准测试，展示了该数据集在促进动作估计方法发展中的潜力。

Apr, 2024

PST900: RGB-Thermal 校准、数据集和分割网络

本文提出在语义分割中使用基于学习的技术并支持长波红外成像 (LWIR) 技术，解决了 RGB - 热成像相机校准和数据集问题并比较表明使用我们的方法可以获得最佳的结果。

Sep, 2019

基于 RGB 和热像视频的人体动作识别实时算法

我们提出了一种基于深度学习算法的人体动作识别方法，适用于 RGB 和红外热像摄像机，能够在实时性要求的情况下实现行人的检测和跟踪，并可对常见的四种动作进行识别。该方法利用了当前最先进的物体检测、光流和姿势估计技术，经过对视频数据集进行定性实验验证后，证明在 RGB 和热成像视频方面效果稳健。

Apr, 2023

从视频中学习三维人体动力学

通过观察人类运动的视觉序列，我们可以轻松猜测人在过去和未来的 3D 运动。我们提出了一个可以学习人类 3D 动力学表示的框架，通过简单而有效的图像特征时间编码。在测试过程中，学习到的时空表示能够预测具有平稳性的 3D 网格。我们的模型可以从单个图像中恢复当前的 3D 网格以及它未来和过去的 3D 运动，同时也可以通过半监督学习从带有 2D 姿态标注的自然视频中学习。我们通过对来自互联网海量未标记数据的模型训练，通过已有的 2D 姿态检测器得到伪基础真值 2D 姿态，证明了我们的模型可以自举学习并在三维动作预测任务中获得最新的性能。

Dec, 2018

RGBD 数据集：过去、现在和未来

本文探讨了与 RGBD 数据集有关的八个类别，并提出了一些关于其未来的方向，这有助于研究人员找到适合他们需求的数据，并考虑哪些数据集在推动计算机视觉方向上取得了成功和原因。

Apr, 2016

从静态图像预测人类动态

研究使用单个 RGB 图像预测人体动态，提出了 3D Pose Forecasting Network (3D-PFNet)，结合 2D 预测和 3D 空间，在多样化的数据源下进行了三步训练，展示了在 2D 姿势预测和 3D 姿势恢复上有竞争力的性能结果。

Apr, 2017

从视频预测三维人体动态

本篇论文提出了一种可以根据过去的视频输入，预测人体未来三维网格模型序列的方法，通过引入自回归模型在中间潜在空间上进行预测，有效地促进了自回归预测。

Aug, 2019

低光条件下可见光到热像转换以提高视觉任务效果

本文提出了一种利用生成网络和检测网络将 RGB 图像转化为热成像图像的端到端框架，并通过生成的热成像图像与真实数据进行比较，论证了使用生成对抗网络将 RGB 训练数据转化为热成像数据的可行性，从而加快和降低生成热成像数据的成本，满足安全应用的需求。

Oct, 2023

从单个 RGB 相机学习重建穿着衣服的人

本文提出了一种基于学习的模型，利用少量单目视频帧 (1-8 帧) 从移动的人中推断出其个性化的 3D 形状，可在不到 10 秒内达到 5mm 的重建精度。该模型学习预测一个统计体型模型的参数和实例化偏移量，同时加入衣服和头发的形状，具有快速和准确的预测，这得益于其对 T-pose 空间的预测和从上往下和从下往上两个视图预测的结合。该模型仅基于合成的 3D 数据进行学习，可将可变数量的帧作为输入，即使仅有一张图像，也能以 6mm 的精度重建形状。3 个不同数据集的结果表明了本方法的有效性和准确性。

Mar, 2019

使用红外和热成像融合进行火灾场景的实时人体检测

该论文提出了一种基于烟雾引起的低能见度场景中的热红外成像融合策略的人体检测系统，通过多摄像机处理收集重要信息，融合提取的特征输入轻量级深度神经网络进行人体检测任务，实验表明该方法在合理速度下能够以 95% 的 [email protected] 值取得良好性能。

Jul, 2023