研究利用基于分布估计器的递归神经网络的概率模型来建模多声部音乐的问题,可以提高多声部转录的准确性。
Jun, 2012
我们设计了一种新的深度学习网络架构 DBN-BLSTM,该网络结合了深度信号表示和时间信息,加强了序列数据的建模,在音乐生成任务中表现出最优性能。
Dec, 2014
本研究尝试使用深度神经网络建立生成模型,以生成既有和声和旋律,并且足以通过人类作曲的音乐,并利用端到端学习和生成的方法。
Jun, 2016
本文提出了一种基于序列生成对抗网络的应用方法 (SeqGAN),用于创建和捕获音符和和弦的多声部音乐序列的表征,同时利用神经网络从该嵌入式音乐词空间的模拟分布中学习预测序列的分布,实验表明该方法可以稳定地训练 GAN 并创造出具有音乐连贯性且在定量和定性方面均有所提升的音乐序列。
Oct, 2017
本文提出了一种基于 BLSTM 循环神经网络的多音事件检测方法,该方法通过训练一个多标签 BLSTM RNN,将包括音乐、车辆、讲话等 61 类在内的多种声音的声学特征映射到每个事件类别的二进制活动指示符上,并且通过使用数据增强技术进一步提高了识别结果的准确性,系统在实测中平均 F1 分数分别为 65.5%和 64.7%。
Apr, 2016
通过构建时序 Sigmoid 置信网络的层次结构,设计深动态生成模型,引入识别模型从变分后验中快速采样,提出的方法在多种序列数据上取得最先进的预测性能,能够合成各种序列。
Sep, 2015
该论文在音乐生成的深度学习系统中引入了一种新颖的图表示方法和深度变分自编码器,将音乐的结构和内容分开生成,实现了更具层次结构的人机交互音乐创作方式。
Jul, 2023
提出了一种适用于多声部音乐生成的神经网络模型 Choir Transformer,并引入了相对位置注意力机制以更好地建模音乐的结构,提出了适用于多声部音乐生成的音乐表示方法。Choir Transformer 的性能超过了之前最先进的准确率达到 4.06%。实验证明其和巴赫音乐的和声度接近。在实际应用中,生成的旋律和节奏可以根据特定输入进行调整,从而产生不同风格的音乐,如民谣音乐或流行音乐等。
Aug, 2023
本文提出了使用卷积变分递归神经网络对音乐进行特征捕捉和创作新音乐序列的模型,通过编码器 - 解码器架构和概率连接捕获音乐的隐藏结构,并使用 Variable Markov Oracle 方法对不同神经网络类型的性能进行比较,结果表明所提出的模型具有更好的统计相似性和更好地保留了原始音乐的风格。
Oct, 2018
使用 LSTM 网络在音乐生成中得到了初步的应用,该方法是一种在深度学习中具有广泛应用的序列建模方法。
Mar, 2022