MMNov, 2023

基于骨架的动作理解的统一多模态无监督表示学习

TL;DR无监督预训练及早融合策略的统一多模态无监督表示学习框架(UmURL)旨在提取骨架输入的统一表示,通过特征分解和对齐保证多模态特征包含各模态的完整语义,并在各种场景中实现鲁棒动作理解。该框架在三个大规模数据集上取得了新的多种下游任务场景中骨架 - based 动作表示学习的最先进性能。