透过二阶段方法构建及修饰：结构良好的钢琴演奏生成

Sep, 2022

透过二阶段方法构建及修饰：结构良好的钢琴演奏生成

Compose & Embellish: Well-Structured Piano Performance Generation via A Two-Stage Approach

Shih-Lun Wu, Yi-Hsuan Yang

TL;DR本文提出了一种基于 Transformer 模型的两阶段框架，首先用 Compose & Embellish 方法创作出一个简单音乐谱，然后加入 Begleitungen 及其他表现手法，明显缩小了当前技术与真实表演之间的差距，同时提高了乐曲的丰富性和连贯性，也可以对非钢琴数据进行预训练。

Abstract

Even with strong sequence models like Transformers, generating expressive piano performances with long-range musical structures remains challenging. Meanwhile, methods to compose well-structured melodies or lead sheets (melody + chords), i.e., simpler forms of music, gained more success. Observing the above, we devise a two-stage →

transformer-based framework lead sheet accompaniment expressive touches pretraining

发现论文，激发创造

流行音乐变压器：基于节拍的建模和生成富有表现力的流行钢琴作品

本文提出将乐谱数据表示成具有韵律结构的形式，通过开发更好的数据输入方式，我们建立了一个节奏更流畅的 Pop 钢琴音乐生成模型 - Pop Music Transformer。

Feb, 2020

探究基于 AI 创作音乐的缺陷：以 Jazz Transformer 为例

本文介绍了一种名为 Jazz Transformer 的生成模型，利用名为 Transformer-XL 的神经序列模型来建模爵士乐谱。此外，该模型将 Weimar Jazz 数据库中的结构事件作为诱导生成音乐结构的参考。尽管我们能够将训练损失降低到较低值，但我们的听觉测试显示，生成音乐的平均评分与真实曲目的评分之间存在明显差距。因此，我们会从不同的角度进行一系列计算分析，以进一步证明生成作品与人类艺术作品之间的差距，并为自动创作的未来工作设定一些目标。

Aug, 2020

复合词变压器：学习在动态有向超图上组合全歌曲音乐

该论文提出了一种新型 Transformer 解码器架构，其用于不同的前馈头来模拟不同类型的 tokens，以及一种扩展 - 压缩技巧将邻近的 tokens 分组成复合单词的序列，表现出比现有模型更快和同等质量的学习能力.

Jan, 2021

使用 Transformer 自动编码器对音乐风格进行编码

本篇论文介绍 Transformer 自编码器用于符号音乐生成，提高性能风格和旋律的分开控制能力，并在 MAESTRO 及 Youtube 数据集上实现了比基线更好的结果。

Dec, 2019

跨域预训练改进多乐器音乐生成

该研究探讨了如何使用 Transformer 结构生成多乐器音乐乐谱，使用 NES-MDB 数据集进行了实验并采用预训练方法利用 Lakh MIDI 数据集进一步提高生成效果。

Jul, 2019

利用 Transformer 网络重建钢琴演奏中的人类表现力

本文提出了一种使用多层双向 Transformer 编码器重建钢琴演奏人类表现力的新方法，并使用现有的转录模型得到的转录乐谱来训练我们的模型，在此基础上通过控制采样过程中的钢琴家身份探索我们系统模拟不同钢琴家表现力差异的能力，在统计生成的表现力强的演奏和听力测试中对该系统进行评估，结果表明我们的方法实现了从转录分数生成类似于人类钢琴演奏的结果的最新技术水平，同时全面且一致地重建了人类的表现力，这进一步提出了挑战。

Jun, 2023

音乐形式生成

该论文介绍了一种生成结构化的、任意长度的音乐作品的方法，其中利用条件性生成模型创建了音乐片段，并通过转换连接这些片段，然后利用大型语言模型提出音乐形式建议。

Oct, 2023

基于 Transformer 的序列到序列钢琴转录

本文展示了使用通用 encoder-decoder Transformer 和标准解码方法可实现与专业领域特定设计模型同等效果的自动音乐转录方法，从而取消了任务特定架构的需求，简化了转录，为集中精力于数据集创建和标注而非模型设计提供了可能性。

Jul, 2021

通过解耦音色表示实现音乐作曲风格转移

本文介绍一种基于深度学习的音乐曲目排列模型，通过对乐曲音频的编码和解码预测其乐谱，并使用解缠技术将其中代表音乐内容和乐器的因素分离，实现曲式转换。

May, 2019

基于和谐感知学习的结构增强流行音乐生成

本文提出了一种基于和声学习的结构增强流行音乐生成方法，并设计了和声感知的分层音乐变形器 (HAT)，可以在多层级音乐元素中自适应地利用结构，从而提高生成的流行音乐的质量。实验结果表明，与现有方法相比，HAT 可以更好地理解结构，尤其是在形式和质地方面可以提高生成音乐的质量。

Sep, 2021