PerformanceNet: 多频段卷积残差网络得分转音频音乐生成

AAAINov, 2018

PerformanceNet: 多频段卷积残差网络得分转音频音乐生成

PerformanceNet: Score-to-Audio Music Generation with Multi-Band Convolutional Residual Network

Bryan Wang, Yi-Hsuan Yang

TL;DR提出了一个深度卷积模型，学习了乐谱和音频之间的符号表示之间的得分与音频之间的映射，通过用户研究发现，该模型在自然度和情感表现方面的平均意见分数高于 WaveNet 模型和两个商业声音库。

Abstract

music creation is typically composed of two parts: composing the musical score, and then performing the score with instruments to make sounds. While recent work has made much progress in automatic music generation in the symbolic domain, few attempts have been made to build an

music creation ai model score-to-audio mapping spectrograms user study

发现论文，激发创造

MidiNet：一种用于符号域音乐生成的卷积生成对抗网络

本文提出一种基于卷积神经网络的生成式对抗网络 MidiNet，用于在符号域中生成旋律，其能够通过先前的和弦序列或前几小节的旋律生成新的旋律，相比 MelodyRNN 模型表现更为出色。

Mar, 2017

针对乐谱图像的分数跟随技术

本文介绍了一种通过神经网络匹配短音频片段与乐谱中对应像素位置的方法。实验结果表明，使用深度学习技术处理音乐乐谱具有可行性且是一个有前途的研究方向。

Dec, 2016

音乐的深度学习

本研究尝试使用深度神经网络建立生成模型，以生成既有和声和旋律，并且足以通过人类作曲的音乐，并利用端到端学习和生成的方法。

Jun, 2016

从头开始学习音乐特征

本文介绍了一个新的大规模音乐数据集 MusicNet，旨在为音乐研究的机器学习方法提供监督和评估，该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成，其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。

Nov, 2016

MuseGAN: 多轨序列生成对抗网络用于符号音乐生成和伴奏

本文提出了三个基于生成对抗网络的符号化多轨音乐生成模型，并通过客观和主观的评估方法证明了这些模型的有效性。此外，该文还介绍了一些评估生成结果的标准，并通过与人类协作音乐生成的实验进行探讨。

Sep, 2017

使用卷积神经网络自动识别多音乐器中的乐器

本文介绍了利用卷积神经网络进行自动乐器识别的应用。在这个模型中，特征提取和学习算法是通过端到端方式一起训练的。通过基于原始音频训练的卷积神经网络所取得的结果表明，其性能优于那些依赖手工制作特征的传统方法。

Nov, 2015

使用 WaveNet 自编码器进行音乐音符的神经音频合成

本研究提出了一种基于 WaveNet 风格自编码器的新型音频模型，进一步介绍了一个规模较大质量较高的音乐数据集 NSynth。使用 NSynth 数据集，我们证明 WaveNet 自编码器比使用频谱自编码器基线的性能有显著提高，同时演示了该模型学习嵌入的能力，实现了在音色上的差值并创造了新类型的逼真和有表现力的声音。

Apr, 2017

基于频谱扩散的多乐器音乐合成

本文介绍了利用神经合成器实时生成任意乐器和音符组合的音频，其具有互动性和表现力，使用 MIDI 序列进行训练，采用两阶段过程转换为声谱图，然后通过生成对抗网络（GAN）声谱图反演器将其转化为音频，发现 DDPM 方法在质量和重建等方面具有显著的优势。

Jun, 2022

灵活音色控制的神经音乐合成

本研究提出了一种基于神经网络的音乐合成模型，并使用具有灵活音色控制的嵌入学习来实现乐器的多样性和交互。

Nov, 2018

为结构化自动音乐生成模型调整深度生成原始音频模型

本文提出了一种将深度学习中的原始音频模型和符号模型相结合的音乐自动生成方法，使用 LSTM 网络学习音乐的旋律结构，再将符号生成作为 WaveNet 原始音频生成器的条件输入，从而生成出有结构且听起来逼真的音乐。

Jun, 2018