通过使用机器学习算法和从音频信号提取的特征进行音乐流派分类,本研究旨在评估机器学习模型在流派分类中的鲁棒性并进行结果比较。
May, 2024
用五个不同独立的算法对用户上传的歌曲进行分析,通过有监督学习从事例中学习来识别歌曲的独特之处,特别考虑音乐的流派,最终用图形工具展示分析结果。
研究通过比较研究了卷积神经网络(CNN)、VGG16 和 eXtreme Gradient Boosting(XGBoost)三种模型在不同特征上的表现,30 秒的梅尔频谱图和 3 秒的梅尔频率倒谱系数(MFCCs),结果表明 MFCC XGBoost 模型胜出,此外,在数据预处理阶段应用数据分割可以显著提升 CNN 的性能。
Jan, 2024
本研究利用音频、文本和图片三种数据模式,将音乐项目分类到多个细粒度标签中,并利用首创的深度学习技术嵌入了特征分类,提出了 MuMu 数据集,并取得了更好的多标签音乐类型分类结果。
Jul, 2017
本文介绍了一个新的大规模音乐数据集 MusicNet,旨在为音乐研究的机器学习方法提供监督和评估,该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成,其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。
Nov, 2016
介绍以开放数据为基础的音乐流派识别挑战,包括设计、统计数据和结果。
Mar, 2018
本文提供了音频理解模型预训练策略的广泛比较分析,探讨了预训练数据集(音乐或通用音频)和预训练方法(有监督或无监督)对下游任务的影响,特别是在音乐领域的多项任务中,超大规模有人工注释的音乐数据集上训练的有监督模型实现了最先进的性能,而域限制在音乐领域的无监督模型则在某些情况下能实现优异的有监督学习和无监督学习性能,表现出较高的效率和通用性。
Oct, 2022
机器学习的应用已经颠覆了传统的声学处理方法,主要是在语音处理、海洋声学、生物声学和环境声学等领域,通过大量训练数据自动挖掘数据之间的复杂关系,进而描述和预测人类和环境所发出的声音现象。
May, 2019
本文研究应用自监督学习和多任务学习方法预训练音乐编码器,探索编码器结构、损失权重和自监督任务选择对下游音乐分类任务的影响。研究发现,使用多种音乐特定的自监督任务,结合合理的损失权重平衡,可以提高和推广到下游任务。
Feb, 2021
通过使用机器学习模型及百万曲目数据集,本文提出了一个音乐推荐系统,旨在优化为用户推荐喜欢的歌曲。
Sep, 2023