Aug, 2023

多模视觉动作识别的集成建模

TL;DR我们在这项工作中提出了一种用于多模态动作识别的集成建模方法,通过使用适应 MECCANO 数据集的长尾分布的变种焦点损失模型,独立训练各个模态的模型,并基于焦点损失的基本原理,提出了一种指数衰减的焦点损失模型,它能够根据数据集中的所有示例逐渐适应,并鼓励模型在关注稀疏的艰难样本的同时,利用简单样本提供的信息,最后采用后期融合策略将 RGB 和深度模态的概率分布进行组合,以进行最终的动作预测。在 MECCANO 数据集上进行的实验评估证明了我们方法的有效性。