透过二阶段方法构建及修饰:结构良好的钢琴演奏生成
本文提出将乐谱数据表示成具有韵律结构的形式,通过开发更好的数据输入方式,我们建立了一个节奏更流畅的 Pop 钢琴音乐生成模型 - Pop Music Transformer。
Feb, 2020
本文介绍了一种名为 Jazz Transformer 的生成模型,利用名为 Transformer-XL 的神经序列模型来建模爵士乐谱。此外,该模型将 Weimar Jazz 数据库中的结构事件作为诱导生成音乐结构的参考。尽管我们能够将训练损失降低到较低值,但我们的听觉测试显示,生成音乐的平均评分与真实曲目的评分之间存在明显差距。因此,我们会从不同的角度进行一系列计算分析,以进一步证明生成作品与人类艺术作品之间的差距,并为自动创作的未来工作设定一些目标。
Aug, 2020
该论文提出了一种新型 Transformer 解码器架构,其用于不同的前馈头来模拟不同类型的 tokens,以及一种扩展 - 压缩技巧将邻近的 tokens 分组成复合单词的序列,表现出比现有模型更快和同等质量的学习能力.
Jan, 2021
本篇论文介绍 Transformer 自编码器用于符号音乐生成,提高性能风格和旋律的分开控制能力,并在 MAESTRO 及 Youtube 数据集上实现了比基线更好的结果。
Dec, 2019
该研究探讨了如何使用 Transformer 结构生成多乐器音乐乐谱,使用 NES-MDB 数据集进行了实验并采用预训练方法利用 Lakh MIDI 数据集进一步提高生成效果。
Jul, 2019
本文提出了一种使用多层双向 Transformer 编码器重建钢琴演奏人类表现力的新方法,并使用现有的转录模型得到的转录乐谱来训练我们的模型,在此基础上通过控制采样过程中的钢琴家身份探索我们系统模拟不同钢琴家表现力差异的能力,在统计生成的表现力强的演奏和听力测试中对该系统进行评估,结果表明我们的方法实现了从转录分数生成类似于人类钢琴演奏的结果的最新技术水平,同时全面且一致地重建了人类的表现力,这进一步提出了挑战。
Jun, 2023
本文展示了使用通用 encoder-decoder Transformer 和标准解码方法可实现与专业领域特定设计模型同等效果的自动音乐转录方法,从而取消了任务特定架构的需求,简化了转录,为集中精力于数据集创建和标注而非模型设计提供了可能性。
Jul, 2021
本文介绍一种基于深度学习的音乐曲目排列模型,通过对乐曲音频的编码和解码预测其乐谱,并使用解缠技术将其中代表音乐内容和乐器的因素分离,实现曲式转换。
May, 2019
本文提出了一种基于和声学习的结构增强流行音乐生成方法,并设计了和声感知的分层音乐变形器 (HAT),可以在多层级音乐元素中自适应地利用结构,从而提高生成的流行音乐的质量。实验结果表明,与现有方法相比,HAT 可以更好地理解结构,尤其是在形式和质地方面可以提高生成音乐的质量。
Sep, 2021