从音频中学习识别音乐流派
用五个不同独立的算法对用户上传的歌曲进行分析,通过有监督学习从事例中学习来识别歌曲的独特之处,特别考虑音乐的流派,最终用图形工具展示分析结果。
May, 2024
通过使用基于人工智能的生成音乐系统为音乐信息检索(MIR)任务生成训练数据,我们探讨了更广泛的概念。为了启动这个研究方向,我们进行了一项初步实验,利用 MusicGen 创建了一个完全人工的音乐数据集,在此基础上我们训练了一个流派分类器。我们制作了超过 50,000 个以流派为条件的文本描述,并生成了一系列覆盖五种音乐流派的音乐片段。我们的初步结果表明,所提出的模型能够从人工音乐曲目中学习到流派特定的特征,并在现实世界的音乐录音中推广得很好。
Nov, 2023
本文介绍了一个新的大规模音乐数据集 MusicNet,旨在为音乐研究的机器学习方法提供监督和评估,该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成,其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。
Nov, 2016
本文应用机器学习方法,特别是监督学习,对音乐流派进行分类,通过提取音频文件特征并使用多种分类算法(如 LogisticRegression,SVC 和 DecisionTreeClassifier),将音乐分类为古典和重金属两个分类。
May, 2023
本研究利用音频、文本和图片三种数据模式,将音乐项目分类到多个细粒度标签中,并利用首创的深度学习技术嵌入了特征分类,提出了 MuMu 数据集,并取得了更好的多标签音乐类型分类结果。
Jul, 2017
利用 Jukebox 描述音频数据,并结合新数据集进行模型训练,在旋律转录方面取得了令人瞩目的进展,从而实现了直接从音频转录可阅读的乐谱的 Sheet Sage 系统。
Dec, 2022
研究了如何利用音乐中的重复元素,在大规模音乐数据库中实现有效和高效的自动音乐类型分类,以便于数字图书馆中音乐作品的访问和组织。我们提供了一组不同类型的模式用于支持音乐学研究,并实验了两种快速算法以应用于大规模且多样化的语料库。
Oct, 2019
深度学习模型在音乐方面取得了巨大的进展,但现如今机器学习模型在准确捕捉情感方面有多好以及研究人员面临哪些挑战呢?本文提供了可用的音乐情感数据集的综合概述,讨论了评估标准以及该领域中的竞赛,并简要概述了多种音乐情感预测模型,为该领域内的多样化方法提供了见解。通过这个研究,我们强调了在准确捕捉音乐情感方面存在的挑战。鉴于该领域的动态性,我们还未我们的发现补充了一个相应的 GitHub 仓库。该仓库包含了音乐情感数据集和最近的预测模型的全面列表。
Jun, 2024
本文介绍了 DCASE 2018 挑战赛的任务 2,即使用 AudioSet 标签对 Freesound 内容进行通用音频标记。本人们在 Kaggle 平台上托管了此任务, 目标是建立能够识别来自 41 个不同类别的音频剪辑的类别的音频标记系统。我们介绍了任务、为比赛准备的数据集和基准系统。
Jul, 2018