GTR-CTRL: 基于 Transformer 的吉他音乐生成中的乐器和类型调节

MMFeb, 2023

GTR-CTRL: 基于 Transformer 的吉他音乐生成中的乐器和类型调节

GTR-CTRL: Instrument and Genre Conditioning for Guitar-Focused Music Generation with Transformers

Pedro Sarmento, Adarsh Kumar, Yu-Hua Chen, CJ Carr, Zack Zukowski...

TL;DR本文介绍如何使用深度学习技术创造出吉他 Tablature 格式的音乐，实现了基于乐器和音乐风格的控制，证明在生成吉他专业音乐方面的相对效果。

Abstract

Recently, symbolic music generation with deep learning techniques has witnessed steady improvements. Most works on this topic focus on MIDI representations, but less attention has been paid to →

symbolic music generation guitar tablatures deep learning instrumentation genre

发现论文，激发创造

ProgGP：从 Guitar Pro 吉他谱神经生成到渐进金属音乐制作

本文利用基于 GuitarPro 格式的记号作为输入和输出表现的 Fine-Tuning 预训练的 Transformer 模型，结合混合方法的定量和定性分析，创作出了一首 Prog 金属乐曲，并展示了该模型的价值。

Jul, 2023

DadaGP: 用于序列模型的分词 GuitarPro 歌曲数据集

本文章介绍了 DadaGP，这是一个全新的符号音乐数据集，包括 26,181 首 GuitarPro 格式的歌曲，涵盖 739 种音乐流派，以及一个适用于生成序列模型（如 Transformer）的令牌格式。使用 DadaGP 可以训练吉他谱生成器、创建新的音乐风格、音乐风格转移和艺术家 / 流派分类等用例。

Jul, 2021

CTRL: 条件可控的 Transformer 语言模型生成器

发布了一个 1.63 亿参数的条件变换器语言模型 CTRL，它被训练用于控制由结构派生而来的控制代码来控制风格、内容和任务特定行为，从而提供更明确的文本生成控制。

Sep, 2019

跨域预训练改进多乐器音乐生成

该研究探讨了如何使用 Transformer 结构生成多乐器音乐乐谱，使用 NES-MDB 数据集进行了实验并采用预训练方法利用 Lakh MIDI 数据集进一步提高生成效果。

Jul, 2019

基于扩散的多乐器音乐合成的性能调整

在音乐信息检索（MIR）中，从符号音乐表示生成多仪器音乐是一项重要任务。本研究的主要贡献是提出通过将生成模型的条件设置为特定表演和录音环境，从而增强多仪器合成的控制能力，从而更好地引导音色和风格。通过基于最先进的扩散音乐生成模型，我们引入了性能条件化，这是一种简单的工具，表明生成模型可以合成具有特定表演所使用的特定乐器的音乐的风格和音色。我们的原型采用各种仪器的非编目表演进行评估，实现了最先进的 FAD 真实性评分，并允许新的音色和风格控制。我们的项目页面，包括样本和演示，可在 benadar293.github.io/midipm 上找到。

Sep, 2023

StemGen: 一种音乐生成模型

使用深度学习技术的音乐音频的端到端生成最近有很大活动。本文提出了一种替代范式，用于生成能够听取和响应音乐上下文的音乐生成模型。使用非自回归、基于 Transformer 的模型架构构建了这样一个模型，并提出了一系列新颖的架构和采样改进方法。我们在开源和专有数据集上训练了这个描述的架构。我们使用标准质量度量和基于音乐信息检索描述符的新方法来评估生成的模型。所得到的模型在音频质量上达到了最先进的基于文本的模型水平，并且在音乐连贯性方面表现出很强的上下文关联性。

Dec, 2023

主题变换器：带主题条件的符号音乐生成器

本文提出了一种基于主题的条件控制机制，通过深度学习的对比学习和聚类技术自动提取音乐片段中的主题材料，并在序列到序列编码器 / 解码器结构中使用了一种新的门控并行注意力模块来更有效地考虑给定的感应主题材料，以生成具有重复和合理变化的多声部流行钢琴音乐。

Nov, 2021

简单且可控的音乐生成

本文介绍了 MusicGen 这个单一语言模型，能够生成高质量的音乐样本，实现对文本描述或旋律特征的有条件创作，并经过广泛的实证评估，表明其在标准的文本到音乐基准上优于其他模型。

Jun, 2023

互动背景下的音乐生成调查

近年来，机器学习，特别是生成对抗神经网络（GANs）和基于注意力的神经网络（transformers），已成功用于作曲和生成音乐，包括旋律和多声部作品。然而，现有研究主要集中在风格复制和转换的问题上，并未涉及到人机共同创作和评估。本文综述了音乐表征、特征分析、启发式算法、统计和参数建模，人类和自动化评估措施，并讨论了哪种方法和模型最适合于实时互动。

Feb, 2024

流行音乐变压器：基于节拍的建模和生成富有表现力的流行钢琴作品

本文提出将乐谱数据表示成具有韵律结构的形式，通过开发更好的数据输入方式，我们建立了一个节奏更流畅的 Pop 钢琴音乐生成模型 - Pop Music Transformer。

Feb, 2020