Oct, 2024

MotionBank:一种具有解耦规则注释的大规模视频运动基准

TL;DR本研究解决了如何构建和基准化大规模运动模型(LMM)的问题。通过整合13个视频动作数据集,创建了MotionBank,包括124万条运动序列,提供了丰富的自然人类运动数据,改进了运动与文本的对齐,显著推动了人类运动生成及理解相关任务的发展。