Jan, 2024

音乐类型分类:使用 Mel 频率倒谱系数和 Mel 频谱图的 CNN 和 XGBoost 方法的比较分析

TL;DR研究通过比较研究了卷积神经网络(CNN)、VGG16 和 eXtreme Gradient Boosting(XGBoost)三种模型在不同特征上的表现,30 秒的梅尔频谱图和 3 秒的梅尔频率倒谱系数(MFCCs),结果表明 MFCC XGBoost 模型胜出,此外,在数据预处理阶段应用数据分割可以显著提升 CNN 的性能。