May, 2024

基于文本的三维人体动作检索的跨数据库研究

TL;DR我们提供了一项关于基于文本的三维人体动作检索的研究结果,重点关注跨数据集的泛化问题。通过采用统一的 SMPL 人体格式,我们能够对一个数据集进行训练,对另一个进行测试,或者对多个数据集进行训练。研究结果表明,标准的文本 - 动作基准数据集(如 HumanML3D、KIT Motion-Language 和 BABEL)存在数据集偏差。我们展示了文本增强在一定程度上可以缩小领域差距,但仍存在差距。此外,我们首次提供了使用 BABEL 进行零样本动作识别的结果,而在训练过程中没有使用分类动作标签,开辟了未来研究的新方向。