ICCVSep, 2023

RenderIH: 一个用于 3D 交互式手势姿势估计的大规模合成数据集

TL;DR为了提高手部姿势估计的准确性,研究提出了一个大规模的合成数据集 RenderIH,其中包含 100 万张具有不同背景、视角和手部纹理的逼真照片。为了生成自然和多样化的交互姿势,提出了一种新的姿势优化算法。而用于姿势估计的基于 Transformer 的模型 TransHand 则能够利用交互手部之间的相关性,并验证 RenderIH 在改善结果方面的有效性。经过实验证明,使用该合成数据集进行预训练可以显著将误差从 6.76mm 降至 5.79mm,并且 TransHand 在性能上超越了其他方法。