MusPy: 符号音乐生成工具包
通过引入 GETMusic 统一音乐表示和扩散框架,该论文提出一种方法,名为 GETScore,将音符表示为符号并以 2D 结构组织,可控制任何音乐轨道的生成和脱离其自回归行为,实现高质量的音乐生成。
May, 2023
本文介绍了 MuseCoco,一种从文本描述中生成符号音乐的方法,通过将任务分解为文本到属性理解和属性到音乐生成阶段,并提供几种控制选项,使得音乐生成更具数据效率和精准控制性。
May, 2023
近期自然语言处理进展中,语言模型如 Transformers 已被应用于符号音乐,可用于音乐生成、建模或转录,拥有最先进的性能。为了对骨干模型进行音乐编码和解码,需要依赖于令牌化器,其作用是将音乐序列化为称为令牌的不同元素序列。MidiTok 是一个开源库,提供对符号音乐进行令牌化的灵活性和扩展功能,具备最受欢迎的音乐令牌化,并具备统一的 API,旨在方便所有人使用和扩展。
Oct, 2023
本文探讨了大型语言模型(LLMs)在音乐的预训练中的应用。研究发现,LLMs 与 ABC 记谱法更加兼容,提高了音乐创作模型的性能。为了解决不同音轨间的错位问题,我们提出了一种名为 Synchronized Multi-Track ABC Notation(SMT-ABC Notation)的方法,旨在保持多个音乐音轨之间的一致性。我们的贡献包括一系列能够处理 8192 个标记的模型,覆盖了训练集中 90%的符号音乐数据。此外,我们还研究了符号音乐缩放定律(SMS Law)对模型性能的影响。研究结果表明了音乐生成领域未来研究的一个有前途的方向,并通过我们的开源贡献为社区主导的研究提供了丰富的资源。
Apr, 2024
本文提出了三个基于生成对抗网络的符号化多轨音乐生成模型,并通过客观和主观的评估方法证明了这些模型的有效性。此外,该文还介绍了一些评估生成结果的标准,并通过与人类协作音乐生成的实验进行探讨。
Sep, 2017
我们提出了一种基于单纯扩散的快速可控符号音乐生成新方法,该方法与自然语言处理领域的目标相结合,应用于使用无序表示生成 4 小节多乐器音乐循环。我们展示了我们的模型可以通过词汇先验进行驾驭,从而在音乐生成过程中提供了可观的控制水平,例如,填充时间和音高以及选择乐器,而无需特定任务的模型适应或应用外在控制。
May, 2024
我们提出了一个新的大规模情感标记的符号音乐数据集,该数据集包括 12k 首 MIDI 音乐。通过在 GoEmotions 数据集上训练情感分类模型,我们实现了半基线模型大小的先进结果。然后,我们将这些模型应用到两个大规模 MIDI 数据集的歌词上。我们的数据集涵盖了广泛的细粒度情感,为探究音乐与情感之间的联系以及基于特定情感生成音乐的模型的发展提供了宝贵的资源。我们的推断代码、训练模型和数据集在网上可获得。
Jul, 2023
本研究介绍了一种基于 Python 的电子舞曲音频生成、深度学习技术和符号音乐的自动化结构,可用于 MIR 的 EDM 歌曲,以缓解获取标注数据的难度。研究表明,我们的混音可以在主观和客观标准上达到与世界知名艺术家制作的参考歌曲相同的质量。
May, 2023
Musika 是一個快速的音樂生成系統,透過將 spectrogram 轉換成可逆表示並透過生成對抗網路以一個特定的音樂領域進行訓練,使用單一普通消費 GPU 進行訓練並能在消費 CPU 上以比實時更快的速度生成任意長度的音樂,並提供使用者控制選項。
Aug, 2022
本文介绍了 MusicGen 这个单一语言模型,能够生成高质量的音乐样本,实现对文本描述或旋律特征的有条件创作,并经过广泛的实证评估,表明其在标准的文本到音乐基准上优于其他模型。
Jun, 2023