基于文本的 LSTM 网络自动音乐创作
本文采用深度学习方法,具体来说是 LSTM 网络,用于音乐转录建模和创作,使用大约 23,000 个高级词汇(ABC 符号)表示的音乐转录来构建和训练 LSTM 网络,并用其生成新的转录。实际目的是在特定的音乐创作情境中创建有用的音乐转录模型,我们从三个方面展示了结果:1)在种群水平上,比较训练转录和生成转录集的描述性统计数据;2)在个体水平上,研究生成的转录如何反映训练转录中音乐实践的惯例(凯尔特民间音乐);3)在应用级别上,使用该系统进行音乐创作的创意生成。我们开放和提供了我们的数据集、软件和声音示例:https://github.com/IraKorshunova/folk-rnn。
Apr, 2016
提出了一种计算机音乐作曲框架,利用鲁棒传播 (RProp) 和 长短期记忆 (LSTM) 循环神经网络,成功展示 LSTM 网络适当学习音乐的结构和特征,同时显示利用 RProp 预测现有音乐的结果优于 BPTT。
Dec, 2014
通过整合多个 RNN 模型,本研究提出了一个系统,旨在协同人类进行音乐创作,使创作过程更具多样性,通过根据反馈动态调整用户创意意图,系统增强了生成符合用户偏好和创意需求的旋律的能力,通过对具有不同背景的作曲家的实验验证了系统的有效性,进一步完善了音乐创作的可能性,突显了作曲家与人工智能的互动在使音乐创作更加个性化和易于接触方面的重要性,这个系统代表了将人工智能整合到创作过程中的一步,提供了一个新的音乐创作支持和协同艺术探索的工具。
Mar, 2024
利用循环神经网络,模拟学习了披头士音乐风格和音乐知识,能够在较小人为干预下生成类似披头士风格的音乐作品,并融合音乐理论知识提高音乐质量和结构,生成音乐样品经过专业人士的验证和主观音乐测试,发现其在音乐风格,专业质量和趣味性方面与原作较为接近。
Dec, 2018
本文介绍了一种分层递归神经网络用于创作旋律的方法,该方法通过多个 LSTM 子网络从粗到细逐层生成小节结构、节奏结构和音符,通过两个人类行为实验证明了这种结构相对于单层 LSTM 和现有的 MIdiNet 和 MusicVAE 模型更适合创作旋律。
Dec, 2017
本研究探讨了应用循环神经网络识别音乐中传达的情感,旨在通过将音乐调整到适合听众的情感状态,增强音乐推荐系统并支持治疗干预。我们使用 Russell 的情感象限将音乐分类为四个不同的情感区域,并开发了能够准确预测这些类别的模型。我们的方法涉及使用 Librosa 提取全面的音频特征,并应用各种循环神经网络架构,包括标准 RNN,双向 RNN 和 LSTM 网络。初步实验使用包含 900 个已标记情感象限的音频片段数据集进行,我们将神经网络模型的性能与一组基准分类器进行比较,并分析其在捕捉音乐表达中固有的时间动态方面的有效性。结果表明,在较小的数据集中,较简单的 RNN 架构的表现可能与更复杂的模型相当甚至更优。我们还在较大的数据集上应用了以下实验:一是基于我们原始数据集进行的增强,另一是来自其他来源。这项研究不仅增进了我们对音乐情感影响的理解,还展示了神经网络在创建更个性化和情感共鸣的音乐推荐和治疗系统方面的潜力。
May, 2024
本文提出了一种基于序列到序列框架,利用神经编码器和分层解码器,结合自然语言和旋律创作音乐曲调及准确标定的模型,并在 18,451 首流行歌曲中的歌词 - 旋律匹配对上进行了实验,论文通过人工评估证明了模型生成的旋律比基线模型更优秀。
Sep, 2018
该研究采用深度学习方法,实现基于输入节拍生成单声部旋律的任务,提出了三种有效的方法,并结合差异化、谐和性和结构特点,允许任何人通过输入节拍或现有作品的旋律来创作自己的音乐作品。
Jun, 2023
本文提出了基于 LSTM 递归神经网络的直接演奏音乐生成方法,同时预测音符的表现力、时间和动态变化,取得了良好的主观效果,并得到了专业作曲家和音乐家的反馈。
Aug, 2018