使用机器学习方法进行音频分类

May, 2023

Audio classification using ML methods

Krishna Kumar

TL;DR本文应用机器学习方法，特别是监督学习，对音乐流派进行分类，通过提取音频文件特征并使用多种分类算法（如 LogisticRegression，SVC 和 DecisionTreeClassifier），将音乐分类为古典和重金属两个分类。

Abstract

machine learning systems have achieved outstanding performance in different domains. In this paper machine learning methods have been applied to classification task to classify music genre. The code shows how to

machine learning music genre classification supervised learning audio feature extraction classification algorithms

发现论文，激发创造

音乐类型分类：训练一个 AI 模型

通过使用机器学习算法和从音频信号提取的特征进行音乐流派分类，本研究旨在评估机器学习模型在流派分类中的鲁棒性并进行结果比较。

May, 2024

通过多算法分析和用户友好可视化提升音乐流派分类

用五个不同独立的算法对用户上传的歌曲进行分析，通过有监督学习从事例中学习来识别歌曲的独特之处，特别考虑音乐的流派，最终用图形工具展示分析结果。

May, 2024

音乐类型分类：使用 Mel 频率倒谱系数和 Mel 频谱图的 CNN 和 XGBoost 方法的比较分析

研究通过比较研究了卷积神经网络（CNN）、VGG16 和 eXtreme Gradient Boosting（XGBoost）三种模型在不同特征上的表现，30 秒的梅尔频谱图和 3 秒的梅尔频率倒谱系数（MFCCs），结果表明 MFCC XGBoost 模型胜出，此外，在数据预处理阶段应用数据分割可以显著提升 CNN 的性能。

Jan, 2024

使用深度特征进行音频、文本和图像的多标签音乐分类

本研究利用音频、文本和图片三种数据模式，将音乐项目分类到多个细粒度标签中，并利用首创的深度学习技术嵌入了特征分类，提出了 MuMu 数据集，并取得了更好的多标签音乐类型分类结果。

Jul, 2017

从头开始学习音乐特征

本文介绍了一个新的大规模音乐数据集 MusicNet，旨在为音乐研究的机器学习方法提供监督和评估，该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成，其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。

Nov, 2016

从音频中学习识别音乐流派

介绍以开放数据为基础的音乐流派识别挑战，包括设计、统计数据和结果。

Mar, 2018

音乐理解的有监督和无监督音频表示学习

本文提供了音频理解模型预训练策略的广泛比较分析，探讨了预训练数据集（音乐或通用音频）和预训练方法（有监督或无监督）对下游任务的影响，特别是在音乐领域的多项任务中，超大规模有人工注释的音乐数据集上训练的有监督模型实现了最先进的性能，而域限制在音乐领域的无监督模型则在某些情况下能实现优异的有监督学习和无监督学习性能，表现出较高的效率和通用性。

Oct, 2022

声学中的机器学习：理论与应用

机器学习的应用已经颠覆了传统的声学处理方法，主要是在语音处理、海洋声学、生物声学和环境声学等领域，通过大量训练数据自动挖掘数据之间的复杂关系，进而描述和预测人类和环境所发出的声音现象。

May, 2019

多任务自监督预训练用于音乐分类

本文研究应用自监督学习和多任务学习方法预训练音乐编码器，探索编码器结构、损失权重和自监督任务选择对下游音乐分类任务的影响。研究发现，使用多种音乐特定的自监督任务，结合合理的损失权重平衡，可以提高和推广到下游任务。

Feb, 2021

相关节奏：发现你可能喜欢的音乐的推荐系统

通过使用机器学习模型及百万曲目数据集，本文提出了一个音乐推荐系统，旨在优化为用户推荐喜欢的歌曲。

Sep, 2023