GTR-CTRL: 基于 Transformer 的吉他音乐生成中的乐器和类型调节
本文利用基于 GuitarPro 格式的记号作为输入和输出表现的 Fine-Tuning 预训练的 Transformer 模型,结合混合方法的定量和定性分析,创作出了一首 Prog 金属乐曲,并展示了该模型的价值。
Jul, 2023
本文章介绍了 DadaGP,这是一个全新的符号音乐数据集,包括 26,181 首 GuitarPro 格式的歌曲,涵盖 739 种音乐流派,以及一个适用于生成序列模型(如 Transformer)的令牌格式。使用 DadaGP 可以训练吉他谱生成器、创建新的音乐风格、音乐风格转移和艺术家 / 流派分类等用例。
Jul, 2021
发布了一个 1.63 亿参数的条件变换器语言模型 CTRL,它被训练用于控制由结构派生而来的控制代码来控制风格、内容和任务特定行为,从而提供更明确的文本生成控制。
Sep, 2019
该研究探讨了如何使用 Transformer 结构生成多乐器音乐乐谱,使用 NES-MDB 数据集进行了实验并采用预训练方法利用 Lakh MIDI 数据集进一步提高生成效果。
Jul, 2019
在音乐信息检索(MIR)中,从符号音乐表示生成多仪器音乐是一项重要任务。本研究的主要贡献是提出通过将生成模型的条件设置为特定表演和录音环境,从而增强多仪器合成的控制能力,从而更好地引导音色和风格。通过基于最先进的扩散音乐生成模型,我们引入了性能条件化,这是一种简单的工具,表明生成模型可以合成具有特定表演所使用的特定乐器的音乐的风格和音色。我们的原型采用各种仪器的非编目表演进行评估,实现了最先进的 FAD 真实性评分,并允许新的音色和风格控制。我们的项目页面,包括样本和演示,可在 benadar293.github.io/midipm 上找到。
Sep, 2023
使用深度学习技术的音乐音频的端到端生成最近有很大活动。本文提出了一种替代范式,用于生成能够听取和响应音乐上下文的音乐生成模型。使用非自回归、基于 Transformer 的模型架构构建了这样一个模型,并提出了一系列新颖的架构和采样改进方法。我们在开源和专有数据集上训练了这个描述的架构。我们使用标准质量度量和基于音乐信息检索描述符的新方法来评估生成的模型。所得到的模型在音频质量上达到了最先进的基于文本的模型水平,并且在音乐连贯性方面表现出很强的上下文关联性。
Dec, 2023
本文提出了一种基于主题的条件控制机制,通过深度学习的对比学习和聚类技术自动提取音乐片段中的主题材料,并在序列到序列编码器 / 解码器结构中使用了一种新的门控并行注意力模块来更有效地考虑给定的感应主题材料,以生成具有重复和合理变化的多声部流行钢琴音乐。
Nov, 2021
本文介绍了 MusicGen 这个单一语言模型,能够生成高质量的音乐样本,实现对文本描述或旋律特征的有条件创作,并经过广泛的实证评估,表明其在标准的文本到音乐基准上优于其他模型。
Jun, 2023
近年来,机器学习,特别是生成对抗神经网络(GANs)和基于注意力的神经网络(transformers),已成功用于作曲和生成音乐,包括旋律和多声部作品。然而,现有研究主要集中在风格复制和转换的问题上,并未涉及到人机共同创作和评估。本文综述了音乐表征、特征分析、启发式算法、统计和参数建模,人类和自动化评估措施,并讨论了哪种方法和模型最适合于实时互动。
Feb, 2024
本文提出将乐谱数据表示成具有韵律结构的形式,通过开发更好的数据输入方式,我们建立了一个节奏更流畅的 Pop 钢琴音乐生成模型 - Pop Music Transformer。
Feb, 2020