Jun, 2024
通过语言、姿态和合成 IMU 的联合表示强化基于惯性手部人体动作识别
Enhancing Inertial Hand based HAR through Joint Representation of Language, Pose and Synthetic IMUs
Vitor Fortes Rey, Lala Shakti Swarup Ray, Xia Qingxin, Kaishun Wu, Paul Lukowicz
TL;DR由于 HAR 中标记传感器数据的稀缺性,先前的研究已经转向使用视频数据合成惯性测量单元(IMU)数据,利用其丰富的活动注释。然而,在真实环境中从视频生成 IMU 数据对 HAR 提出了挑战,归因于合成 IMU 数据的质量较差且在细微、细粒度动作方面的效果有限。本文提出了我们的新颖多模态、多任务和对比基于框架方法 Multi$^3$Net 来解决数据有限的问题。我们的预训练过程使用在线存储库的视频,旨在同时学习文本、姿势和 IMU 的联合表示。通过使用视频数据和对比学习,我们的方法旨在增强可穿戴 HAR 性能,特别是在识别细微活动方面。我们的实验结果验证了我们的方法在利用 IMU 数据改善 HAR 性能方面的有效性。我们证明,使用我们的方法从视频生成的合成 IMU 数据训练的模型在识别细粒度活动方面超越了现有方法。