Jun, 2024

Hi5:零人工标注的 2D 手部姿态估计

TL;DR提出一种新的大规模合成手部姿态估计数据集 Hi5 以及一种新的廉价方法来收集高质量合成数据,无需人工注释或验证。在计算机图形学的最新进展下,利用具有多样性性别、肤色和动态环境和摄像机移动的高保真度 3D 手部模型,我们的数据合成流程可以精确控制数据多样性和表示,确保健壮和公平的模型训练。通过使用一台普通消费级个人电脑,我们生成了一个包含 583,000 张图像和准确的姿态注释的数据集,这个数据集紧密地代表了现实世界的变异性。使用 Hi5 训练的姿态估计模型在真实手部基准测试中表现出竞争力,而在遮挡和扰动测试中超过了使用真实数据训练的模型。我们的实验显示出合成数据作为解决现实数据集中数据表示问题的可行方案的有希望的结果。总体而言,本文提供了一种有希望的新方法来创建和注释合成数据,可以降低成本并增加手部姿态估计的数据多样性和质量。