Sep, 2023

工业场景中的主体视角 RGB + 深度行为识别

TL;DR我们的研究集中在认识行为,特别是来自以自我为中心视角的行为,并结合深度模态从工业环境中识别行为。针对现实世界中多模态行为发生的困难,我们提出了一种训练策略,并通过后期融合来结合来自每种模态的预测,这在 MECCANO 数据集上明显优于先前的工作,并在 ICIAP 2023 的多模态行为识别挑战中获得第一名。