Feb, 2024

IMUGPT 2.0:基于语言的传感器人体活动识别的跨模态转移

TL;DR在人类活动识别领域,缺乏大型标记数据集是主要挑战之一。为了解决数据稀缺的问题,最近开始研究跨模态迁移方法,将现有数据集从源模态(如视频)转换为目标模态(IMU)。本研究通过大规模评估语言驱动的跨模态迁移,提出了两个针对实际人类活动识别应用场景的 IMUGPT 扩展,一个是能够滤除无关动作序列以确保生成虚拟 IMU 数据的相关性的动作过滤器,另一个是一套用于测量生成数据多样性的指标,帮助确定何时停止生成虚拟 IMU 数据以实现有效和高效的处理。我们证明了我们的多样性指标可以减少生成虚拟 IMU 数据所需的工作量至少 50%,从而使 IMUGPT 在纯概念证明之外具备实际应用的价值。