Sep, 2023

MelodyGLM:多任务符号化旋律生成的预训练

TL;DR该研究提出了 MelodyGLM,一个多任务预训练框架,用于生成带有长期结构的旋律。研究使用 melodic n-gram 和长跨度抽样策略来创建本地和全局填充任务,以建模旋律中的本地和全局结构。研究还构建了一个包含超过 40 万旋律片段的大规模符号旋律数据集,用于大规模预训练和领域特定的 n-gram 词典构建。主观和客观评估结果表明,MelodyGLM 超过了标准和之前的预训练方法,在旋律连续性、节奏性、结构性和整体质量方面都取得了显著改进。值得注意的是,MelodyGLM 在旋律填充任务上几乎与人类创作的旋律的质量相媲美。