PerformanceNet: 多频段卷积残差网络得分转音频音乐生成
本文提出一种基于卷积神经网络的生成式对抗网络 MidiNet,用于在符号域中生成旋律,其能够通过先前的和弦序列或前几小节的旋律生成新的旋律,相比 MelodyRNN 模型表现更为出色。
Mar, 2017
本文介绍了一个新的大规模音乐数据集 MusicNet,旨在为音乐研究的机器学习方法提供监督和评估,该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成,其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。
Nov, 2016
本文提出了三个基于生成对抗网络的符号化多轨音乐生成模型,并通过客观和主观的评估方法证明了这些模型的有效性。此外,该文还介绍了一些评估生成结果的标准,并通过与人类协作音乐生成的实验进行探讨。
Sep, 2017
本文介绍了利用卷积神经网络进行自动乐器识别的应用。在这个模型中,特征提取和学习算法是通过端到端方式一起训练的。通过基于原始音频训练的卷积神经网络所取得的结果表明,其性能优于那些依赖手工制作特征的传统方法。
Nov, 2015
本研究提出了一种基于 WaveNet 风格自编码器的新型音频模型,进一步介绍了一个规模较大质量较高的音乐数据集 NSynth。使用 NSynth 数据集,我们证明 WaveNet 自编码器比使用频谱自编码器基线的性能有显著提高,同时演示了该模型学习嵌入的能力,实现了在音色上的差值并创造了新类型的逼真和有表现力的声音。
Apr, 2017
本文介绍了利用神经合成器实时生成任意乐器和音符组合的音频,其具有互动性和表现力,使用 MIDI 序列进行训练,采用两阶段过程转换为声谱图,然后通过生成对抗网络(GAN)声谱图反演器将其转化为音频,发现 DDPM 方法在质量和重建等方面具有显著的优势。
Jun, 2022
本文提出了一种将深度学习中的原始音频模型和符号模型相结合的音乐自动生成方法,使用 LSTM 网络学习音乐的旋律结构,再将符号生成作为 WaveNet 原始音频生成器的条件输入,从而生成出有结构且听起来逼真的音乐。
Jun, 2018