May, 2022

分析音乐表演视频的深度神经网络方法

TL;DR该论文介绍了一个自动化标注音乐表演视频中手势的框架,使用 3D 卷积神经网络,通过批处理平衡和空间 - 时间手势表示等方法,成功提高了 12% 的手势识别准确率,对跨多个视频的多个手势 / 类别进行了详细的研究,并探讨了使用音频特征的可能性。