通过文本描述生成地面压力序列用于 HAR
提供了一种新方法 PressureTransferNet,用于使用地面压力信息进行人体活动识别(HAR)。该方法利用不同个体的现有压力数据生成特定活动的特定身体动态地面压力图。通过以源压力图和目标人体属性向量作为输入的编码器 - 解码器模型,生成反映目标属性的新压力图。实验证明了在不同场景下将人体属性精确转移到地面压力图上的有效性。
Aug, 2023
通过聊天 GPT 生成不同的文本描述活动的文字描述,通过运动合成模型 T2M-GPT 生成 3D 人体运动序列,然后转换成流的模拟 IMU 数据,将其与部分真实 IMU 数据结合训练 HAR 模型可以显著提高其性能
May, 2023
引入了 PresSim 框架,该框架通过视觉分析、仿真变形分析和深度学习等技术,从压力传感器收集压力数据的替代方法,以实现人类活动识别的目标。
Feb, 2023
本文研究了基于 VQ-VAE 和 GPT 的人体运动生成的条件生成框架,并表明了通过常用的训练配方(EMA 和 Code Reset),我们可以获得高质量的离散表示。此外,我们在训练期间采用了一种简单的损坏策略来缓解训练 - 测试偏差,并在 HumanML3D 数据集上表现出比竞争方法更好的性能。
Jan, 2023
我们介绍了 T2M-HiFiGPT,这是一种生成人体动作的新型条件生成框架,其基于 RVQ-VAE 和双层 GPT 结构。我们的研究表明,我们基于 CNN 的 RVQ-VAE 能够产生高精度的 2D 时间 - 残差离散动作表示。我们的双层 GPT 结构包括了时间 GPT 和残差 GPT,能够有效地将先前帧和文本描述的信息压缩成 1D 上下文向量,并通过 RVQ-VAE 解码器将生成的残差离散指标转化回动作数据。我们的框架在 HumanML3D 和 KIT-ML 数据集上表现出色,在几乎所有主要指标上产生了异常的结果。通过对 HumanML3D 数据集进行全面的剔除研究,我们进一步验证了我们框架的有效性,并考察了每个组件的贡献。我们的发现表明,相比 VQ-VAE 类型的模型,RVQ-VAE 不仅更擅长捕捉精确的 3D 人体动作,而且计算需求相当。因此,T2M-HiFiGPT 能够以显著提高的准确性生成人体动作,优于最新的基于扩散和 GPT 的方法,如 T2M-GPT 和 Att-T2M。
Dec, 2023
通过结合语言结构辅助模块和上下文感知渐进推理模块,我们提出了一种细粒度的方法,用于生成支持精确文本描述的高质量、有条件的人体动作序列。实验证明,我们的方法在 HumanML3D 和 KIT 测试集上胜过了基于文本驱动的动作生成方法,并能够根据文本条件生成更好的视觉确认动作。
Sep, 2023
使用环境传感器在智能家居中进行人类活动识别具有人类健康和福祉的多种应用。通过引入一种新颖的面向布局无关的智能家居人类活动识别系统建模方法,利用原始传感器数据的自然语言描述的可转移表示能力,我们在新的智能家居环境下构建通用的人类活动识别模型,并通过对基准 CASAS 数据集的实验验证了 TDOST 模型在未知智能家居中的有效性,并详细分析了我们方法的各个组成部分对下游活动识别性能的影响。
May, 2024
本文介绍了一种基于自主数据生成技术以及提供高分辨率的 3D 物理模拟和物质和其描述的文本描述的数据集,旨在推动基于文本的视频 / 模拟实现高水平的物理真实感。
Nov, 2022
利用可穿戴设备进行动作重建已成为一种经济且可行的技术,在稀疏的惯性测量单元(IMUs)数据上建立人体姿势模型存在着困扰,本文通过多传感器的空间重要性和文本描述的监督引入不确定性来获取每个 IMU 的加权特征,并设计了一种层次时间变换器(HTT)和对比学习来实现传感器数据与文本语义的精确时间和特征对齐。实验证明我们的方法在多个指标上相比现有方法有显著改进,尤其是在文本监督下,我们的方法不仅能区分诸如坐下和站起之类的模糊动作,还能产生更精确和自然的动作。
Dec, 2023