Jan, 2024

多模态行动质量评估

TL;DR通过提出一种渐进自适应多模态融合网络(PAMFN),该网络利用视觉信息和音频信息相结合以提高动作质量评估的准确性。研究表明,音频是一种有效的补充信息,尤其对于带有背景音乐的体育项目,如花样滑冰和韵律体操。PAMFN 由三个专注于各自信息的分支和一个逐渐聚合各种信息的混合分支构成,采用了一些创新模块来建立各分支之间的联系。这个研究还引入了自适应融合模块,旨在学习不同动作部分的适应性多模态融合策略。