Apr, 2024

将动作与行走与由 LLM 生成的文本描述对齐

TL;DR本研究探讨了使用大型语言模型 (LLMs) 生成丰富文本描述来描述包括动作和步行模式的运动序列,旨在提高动作识别与根据外观属性检索步行序列的能力,通过应用 LLMs 生成动作的文本描述和运用 LLMs 生成从 DenseGait 数据集中的运动序列的文本描述,研究了外观属性对步行模式的影响,进而对多模态表示进行了对齐。本研究结果在动作理解方面具有潜在的应用价值,为多模态对齐和运动分析的数据增强开辟了新的方向。