通过文本描述生成地面压力序列用于 HAR

Feb, 2024

通过文本描述生成地面压力序列用于 HAR

Text me the data: Generating Ground Pressure Sequence from Textual Descriptions for HAR

Lala Shakti Swarup Ray, Bo Zhou, Sungho Suh, Lars Krupp, Vitor Fortes Rey...

TL;DR利用深度学习技术，使用文本描述生成大量的地面压力序列，通过离散潜在相关性获得由文本描述生成的高质量压力序列，并在实际压力传感器收集的压力动态上评估与仅使用真实数据训练的模型相当的 HAR 模型，将真实数据和合成的训练数据结合，使整体宏 F1 分数提高 5.9%。

Abstract

In human activity recognition (HAR), the availability of substantial ground truth is necessary for training efficient models. However, acquiring ground pressure data through physical sensors itself can be cost-prohibitive, time-consuming. To address this critical need, we introduce

human activity recognition ground truth text-to-pressure deep learning synthesized training data

发现论文，激发创造

PressureTransferNet：基于人类属性引导的动态地面压力剖面转移的压力映射三维模拟

提供了一种新方法 PressureTransferNet，用于使用地面压力信息进行人体活动识别（HAR）。该方法利用不同个体的现有压力数据生成特定活动的特定身体动态地面压力图。通过以源压力图和目标人体属性向量作为输入的编码器 - 解码器模型，生成反映目标属性的新压力图。实验证明了在不同场景下将人体属性精确转移到地面压力图上的有效性。

Aug, 2023

利用文本生成虚拟身体加速度计数据进行人体活动识别

通过聊天 GPT 生成不同的文本描述活动的文字描述，通过运动合成模型 T2M-GPT 生成 3D 人体运动序列，然后转换成流的模拟 IMU 数据，将其与部分真实 IMU 数据结合训练 HAR 模型可以显著提高其性能

May, 2023

PresSim: 基于物理学的 3D 模拟的单目视频动态地面压力分布生成端到端框架

引入了 PresSim 框架，该框架通过视觉分析、仿真变形分析和深度学习等技术，从压力传感器收集压力数据的替代方法，以实现人类活动识别的目标。

Feb, 2023

T2M-GPT: 使用离散表示生成基于文本描述的人体动作

本文研究了基于 VQ-VAE 和 GPT 的人体运动生成的条件生成框架，并表明了通过常用的训练配方（EMA 和 Code Reset），我们可以获得高质量的离散表示。此外，我们在训练期间采用了一种简单的损坏策略来缓解训练 - 测试偏差，并在 HumanML3D 数据集上表现出比竞争方法更好的性能。

Jan, 2023

T2M-HiFiGPT: 从文本描述中生成高质量的人体运动，使用离散残差表示

我们介绍了 T2M-HiFiGPT，这是一种生成人体动作的新型条件生成框架，其基于 RVQ-VAE 和双层 GPT 结构。我们的研究表明，我们基于 CNN 的 RVQ-VAE 能够产生高精度的 2D 时间 - 残差离散动作表示。我们的双层 GPT 结构包括了时间 GPT 和残差 GPT，能够有效地将先前帧和文本描述的信息压缩成 1D 上下文向量，并通过 RVQ-VAE 解码器将生成的残差离散指标转化回动作数据。我们的框架在 HumanML3D 和 KIT-ML 数据集上表现出色，在几乎所有主要指标上产生了异常的结果。通过对 HumanML3D 数据集进行全面的剔除研究，我们进一步验证了我们框架的有效性，并考察了每个组件的贡献。我们的发现表明，相比 VQ-VAE 类型的模型，RVQ-VAE 不仅更擅长捕捉精确的 3D 人体动作，而且计算需求相当。因此，T2M-HiFiGPT 能够以显著提高的准确性生成人体动作，优于最新的基于扩散和 GPT 的方法，如 T2M-GPT 和 Att-T2M。

Dec, 2023

Fg-T2M：基于扩散模型的精细文本驱动人体运动生成

通过结合语言结构辅助模块和上下文感知渐进推理模块，我们提出了一种细粒度的方法，用于生成支持精确文本描述的高质量、有条件的人体动作序列。实验证明，我们的方法在 HumanML3D 和 KIT 测试集上胜过了基于文本驱动的动作生成方法，并能够根据文本条件生成更好的视觉确认动作。

Sep, 2023

智能家居中基于传感器触发的文本描述的无布局依赖的人类活动识别（TDOST）

使用环境传感器在智能家居中进行人类活动识别具有人类健康和福祉的多种应用。通过引入一种新颖的面向布局无关的智能家居人类活动识别系统建模方法，利用原始传感器数据的自然语言描述的可转移表示能力，我们在新的智能家居环境下构建通用的人类活动识别模型，并通过对基准 CASAS 数据集的实验验证了 TDOST 模型在未知智能家居中的有效性，并详细分析了我们方法的各个组成部分对下游活动识别性能的影响。

May, 2024

TPA-Net：生成基于物理动画的文本数据集

本文介绍了一种基于自主数据生成技术以及提供高分辨率的 3D 物理模拟和物质和其描述的文本描述的数据集，旨在推动基于文本的视频 / 模拟实现高水平的物理真实感。

Nov, 2022

文本到数据：以文本控制为主的低资源数据生成

通过无标注数据进行无监督扩散建模的 Text2Data 方法在低资源环境中能够实现跨多种模态的可控性，并具备比现有基线模型更好的性能。

Feb, 2024

空间相关传感器问题：辅助文字语义的 3D 人体动作重建

利用可穿戴设备进行动作重建已成为一种经济且可行的技术，在稀疏的惯性测量单元（IMUs）数据上建立人体姿势模型存在着困扰，本文通过多传感器的空间重要性和文本描述的监督引入不确定性来获取每个 IMU 的加权特征，并设计了一种层次时间变换器（HTT）和对比学习来实现传感器数据与文本语义的精确时间和特征对齐。实验证明我们的方法在多个指标上相比现有方法有显著改进，尤其是在文本监督下，我们的方法不仅能区分诸如坐下和站起之类的模糊动作，还能产生更精确和自然的动作。

Dec, 2023