Jun, 2023

利用多模态合成数据进行工业场景下自我中心人 - 物互动检测

TL;DR本文针对工业环境下自我中心的人物 - 物体交互(EHOI)检测问题,提出了一种生成与注释合成图像数据的流程和工具,并发布了包含多种注释的 EgoISM-HOI 数据集。利用合成的 EHOI 数据,我们设计了一种新的方法,在 RGB 图像上预测和结合多种信号以检测 EHOI,并表明预先训练所提出的方法的性能在真实世界的数据上具有显著的提高。同时,我们公开了数据集、源代码和预训练模型,以支持该领域的研究。