Dec, 2023

合成数据对自我中心手 - 物互动检测有用吗?调查与 HOI-Synth 领域迁移基准

TL;DR通过使用合成数据和域适应技术,我们在自我中心视觉领域研究了提高手物交互检测的有效性。我们介绍了一个模拟器,能够自动生成带有手物接触状态、边界框和像素级分割掩码的合成图像。通过对三个自我中心数据集(VISOR,EgoHOS,ENIGMA-51)的全面实验和比较分析,我们证明了合成数据和域适应技术的使用可以在只对一小部分真实数据进行标注的情况下,实现与传统监督方法相当的性能。当使用由真实目标环境和对象的 3D 模型生成的领域内合成数据进行测试时,我们最好的模型在性能上与仅基于标记真实数据的标准完全监督方法相比表现出持续的改进。我们的研究还为自我中心手物交互检测(HOI-Synth)设定了一个新的域适应基准,并提供了鼓励该领域进行此挑战性任务的基准结果。我们在以下链接上发布了生成的数据、代码和模拟器:this https URL