SIGIRMay, 2023

文本到动作检索:走向人体运动数据和自然语言的联合理解

TL;DR本文探讨如何实现基于文本描述的运动检索任务,利用姿态估计、文本编码和基于分割空时注意力的 Motion Transformer 模型,对大量 3D 骨骼序列进行内容检索,实现了相应的定量度量评估。