Jan, 2024

桌面人机交互的多模态手势识别数据集

TL;DR手势识别是一种不可或缺的自然高效人机交互技术组成部分,特别是在桌面级应用中,可以显著提升人们的生产力。本研究建立了一个名为 GR4DHCI 的数据集,其独特之处在于其固有的自然性、直观性和多样性,其主要目的是作为开发桌面级便携应用的宝贵资源。GR4DHCI 包括超过 7000 个手势样本和 382,447 帧的立体红外和骨骼模态。我们还通过将 27 个不同的手部位置纳入数据集中解决了桌面交互中手部定位的差异问题。建立在 GR4DHCI 数据集的基础上,我们进行了一系列实验研究,结果表明本文提出的细粒度分类块可以提高模型的识别准确性。这篇论文中提出的数据集和实验结果有望推动桌面级手势识别研究的进展。