高度压缩视频中的步态识别
本研究介绍了一种基于模拟的方法和主体特定数据集,用于生成合成视频帧和序列以进行数据增强,由此生成了多模态数据集,其结果表明身份信息在合成生成的示例中得以保留,此数据集和方法可对完全不变式身份识别的研究提供支持。
Oct, 2016
通过基于视频的环境监测老年痴呆患者步态分析,使用深度神经网络从视频中提取出与深度相机相关的三维时空步态特征,可以准确预测出步态的速度和步长信息,并可用于长期环境监测中检测步态方面的有意义变化。
Aug, 2023
该研究旨在利用卷积神经网络从低级运动特征(如光流分量)学习高级描述符,并以此实现视频中人的识别。实验证明,将光流的时空块作为卷积神经网络的输入数据,可以以比以往更低的图像分辨率(即 80x60 像素)获得最先进的步态识别效果。
Mar, 2016
当前的 3D 人体姿势估计技术虽然表现出色,但在复杂的野外视频中理解和提升它们的普适性仍然是一个开放的问题。本文聚焦于 2D 到 3D 姿势提升器的稳健性,并开发了两个基准数据集来检验视频 - based 3D 姿势提升器对包括临时遮挡、动态模糊和像素级噪声在内的一系列常见视频污染的稳健性。我们观察到现有的最先进的 3D 姿势提升器在存在污染的情况下的普适性较差,并提出了两种应对这一问题的技术。首先,我们引入了时间加性高斯噪声 (TAGN) 作为一种简单而有效的 2D 输入姿势数据增强技术。此外,为了将 2D 姿势检测器输出的置信度得分纳入考虑,我们设计了一种置信度感知的卷积 (CA-Conv) 块。通过在受损视频上广泛测试,所提出的策略不断提升了 3D 姿势提升器的稳健性,并为未来研究建立了新的基准。
Dec, 2023
使用步态分析进行人员身份识别,同时利用运动模式进行行人属性识别,提出了 DenseGait 数据集和基于 Transformer 的 GaitFormer 模型,通过预训练和多任务训练,在 CASIA-B 和 FVG 数据集上分别取得了 92.5%和 85.33%的准确率,相比于类似方法提高了 14.2%和 9.67%的准确率,同时能够准确识别性别信息和多种外貌属性。
Oct, 2023
该研究提出了一种个性化 ConvNet 姿态估计器,它可以根据帧与帧之间的时间跨度和人物外貌的特点,在视频中生成高精度的姿态标注,并利用自评模型筛选高质量的标注,并通过自动化的 fine-tune 训练方法将其个性化,相比于通用的 ConvNet,对目标视频的姿态估计得到了大幅提升,表现比现有方法更好。
Nov, 2015
本研究旨在通过应用监督式学习阶段来提高机器人安装的 3D 摄像头在人步态分析中的准确性,采用 37 名健康参与者的数据,使用神经网络对相机的原始估计进行后处理,并证明了这种方法的可行性和优越性。
Jul, 2022
本文通过详细综述对于骨架姿态估计和步态分析成为骨架优势的方式,详细介绍了相关数据集、评估方法、挑战和应用方法,并就每个方面进行了细致的比较,在此基础上就性能分析、潜在研究空白、应用领域以及未来的潜在贡献等方面提出了建议,综合评价了深度学习技术在人体姿态估计和步态识别方面的积极作用,为相关研究社区和其他利益相关方提供了借鉴和参考。
May, 2023
此研究挑战了视觉基于步态识别,特别是基于骨架的步态识别主要依赖于运动模式的普遍假设,揭示了行走序列中隐含的人体测量信息在其中的重要作用。通过比较分析,我们显示去除身高信息会导致三个模型和两个基准测试(CASIA-B 和 GREW)的显著性能下降。此外,我们提出了一个只处理各个姿态而忽略任何时间信息的空间转换模型,它达到了异常好的准确性,强调对外观信息的偏好并指出现有基准测试中的虚假相关性。这些发现强调了对视觉基于步态识别中运动和外观相互作用的细致理解的必要性,促使对该领域方法论假设的重新评估。我们的实验表明,“野外” 数据集更不容易产生虚假相关性,因此需要更多样化和大规模的数据集来推动该领域的发展。
Feb, 2024