从头开始学习音乐特征

Nov, 2016

Learning Features of Music from Scratch

John Thickstun, Zaid Harchaoui, Sham Kakade

TL;DR本文介绍了一个新的大规模音乐数据集 MusicNet，旨在为音乐研究的机器学习方法提供监督和评估，该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成，其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。

Abstract

This paper introduces a new large-scale music dataset, musicnet, to serve as a source of supervision and evaluation of machine learning methods for music research. →

musicnet machine learning classical music multi-label classification neural network

发现论文，激发创造

大规模音乐标记的端到端学习

本研究探讨了基于波形输入和基于视听特征学习的卷积神经网络的两种音乐自动标记设计范式在变量大小的数据集上表现的比较，实验结果表明当训练数据不足时，采用音乐领域假设的基于波形的模型在大规模数据场景中的表现优于基于谱图的模型。

Nov, 2017

针对乐谱图像的分数跟随技术

本文介绍了一种通过神经网络匹配短音频片段与乐谱中对应像素位置的方法。实验结果表明，使用深度学习技术处理音乐乐谱具有可行性且是一个有前途的研究方向。

Dec, 2016

用于音乐生成的深度学习技术 -- 综述

本文介绍和分析运用人工神经网络生成音乐的不同方法，提出五个维度分析框架，包括目标、表示法、体系结构、挑战和策略，通过比较分析不同模型和技术，提出了一种新的多维分类法，并举例说明了目标、表示法、体系结构、挑战和策略的各种选择。

Sep, 2017

使用 MAESTRO 数据集实现分解式钢琴音乐建模和生成

该研究使用 MAESTRO 数据集中的音符事件作为中间表示，训练了一系列的神经网络模型，用于转录、合成和生成具备连贯乐曲结构的音频波形，从而实现了跨六个数量级（0.1ms 到 100s）的音频合成。

Oct, 2018

从人工神经网络到深度学习在音乐生成中的历史、概念和趋势

本文介绍了基于深度学习技术的音乐生成方法，包括早期使用人工神经网络的作品和最近的系统，使用现代深度学习技术和控制手段生成具有不同音乐风格的音乐。

Apr, 2020

PerformanceNet: 多频段卷积残差网络得分转音频音乐生成

提出了一个深度卷积模型，学习了乐谱和音频之间的符号表示之间的得分与音频之间的映射，通过用户研究发现，该模型在自然度和情感表现方面的平均意见分数高于 WaveNet 模型和两个商业声音库。

Nov, 2018

多任务自监督预训练用于音乐分类

本文研究应用自监督学习和多任务学习方法预训练音乐编码器，探索编码器结构、损失权重和自监督任务选择对下游音乐分类任务的影响。研究发现，使用多种音乐特定的自监督任务，结合合理的损失权重平衡，可以提高和推广到下游任务。

Feb, 2021

音乐的深度学习

本研究尝试使用深度神经网络建立生成模型，以生成既有和声和旋律，并且足以通过人类作曲的音乐，并利用端到端学习和生成的方法。

Jun, 2016

针对乐谱识别和离线对齐的音频 - 乐谱对应关系学习

该研究使用神经网络跨模态嵌入空间解决音频和乐谱图像之间的匹配问题，并在五个不同作曲家的古典钢琴音乐上进行实验，展示出多模态神经网络处理乐谱和音频的成果。

Jul, 2017

使用深度学习进行音乐转录建模和创作

本文采用深度学习方法，具体来说是 LSTM 网络，用于音乐转录建模和创作，使用大约 23,000 个高级词汇（ABC 符号）表示的音乐转录来构建和训练 LSTM 网络，并用其生成新的转录。实际目的是在特定的音乐创作情境中创建有用的音乐转录模型，我们从三个方面展示了结果：1）在种群水平上，比较训练转录和生成转录集的描述性统计数据；2）在个体水平上，研究生成的转录如何反映训练转录中音乐实践的惯例（凯尔特民间音乐）；3）在应用级别上，使用该系统进行音乐创作的创意生成。我们开放和提供了我们的数据集、软件和声音示例：https://github.com/IraKorshunova/folk-rnn。

Apr, 2016