Aug, 2015

一种用于音乐自动标记的深度特征包模型

TL;DR本论文提出一种 two-stage learning model,首先使用无监督学习将音频轨迹的局部频谱模式投射到高维稀疏空间中,并将其作为特征包进行总结。然后,在逐层无监督学习特征包的基础上初始化深度神经网络,结合标签标注对其进行精调。在 Magnatagatune 数据集上测试表明,该模型取得了高性能的效果。