符号音乐风格转换与 CycleGAN

Sep, 2018

Symbolic Music Genre Transfer with CycleGAN

Gino Brunner, Yuyi Wang, Roger Wattenhofer, Sumu Zhao

TL;DR本文介绍了使用生成模型（如变分自编码器和生成对抗网络）将基于样式和域的转换技术应用于图像和音乐，并利用具有附加鉴别器的 GAN 模型成功实现了音乐流派转换。该文是 GANs 首次应用于音乐域转换的研究。

Abstract

Deep generative models such as variational autoencoders (VAEs) and Generative Adversarial Networks (gans) have recently been applied to st

generative models variational autoencoders gans music genre transfer

发现论文，激发创造

情绪控制下的快速扩散生成对抗网络模型用于符号音乐生成

我们提出了将扩散模型与生成对抗网络相结合的方法，旨在解决算法音乐生成中的情感控制和计算成本的问题。通过训练变分自编码器得到情感标签的符号音乐数据集的嵌入，并用其来训练扩散模型，我们成功地控制了扩散模型以生成具有特定情感的符号音乐，同时大幅提升了计算效率。

Oct, 2023

MuseGAN: 多轨序列生成对抗网络用于符号音乐生成和伴奏

本文提出了三个基于生成对抗网络的符号化多轨音乐生成模型，并通过客观和主观的评估方法证明了这些模型的有效性。此外，该文还介绍了一些评估生成结果的标准，并通过与人类协作音乐生成的实验进行探讨。

Sep, 2017

使用扩散模型生成符号音乐

本文提出了一种基于预训练变分自编码器的离散领域参数化的扩散模型训练技术，用于离散和连续领域的生成导致更优结果，并在应用于符号音乐领域时表现出很强的无条件生成和条件填充结果，相比基于自回归语言模型的连续嵌入操作更具可行性。

Mar, 2021

使用向量量化离散扩散模型进行特定作曲家风格的符号音乐生成

通过将矢量量化变分自编码器（VQ-VAE）与离散扩散模型结合，我们提出了一种生成具有目标作曲家风格的符号音乐的方法，结果表明，我们的模型在满足给定条件的情况下以 72.36% 的高准确率生成符号音乐。

Oct, 2023

Gated-GAN：用于多集合风格转移的对抗门控网络

本文提出了一种名为 Gated GAN 的多样式图像合成模型，该模型结合了编码器，门控变换器和解码器三个部分，可以实现在一个模型中转换多种样式的输入图像，同时通过辅助分类器识别样式类别，以稳定训练并提高合成图像质量。

Apr, 2019

运用迁移学习技术提高自动爵士旋律生成

使用转移学习解决 Jazz 音乐中数据不足和乐曲自动生成的问题。实验使用两种转移学习方法，其中添加流派标签和使用流派分类器的模型比单独使用 Jazz 数据集更好，但不能充分利用流派不指定的数据集。

Aug, 2019

XGAN: 无监督的多对多图像翻译

本文提出了一种名为 XGAN 的双对抗自编码器，可以无监督地捕捉共同的领域语义内容，同时在两个方向上学习域与域之间的图像转换，并通过语义一致性损失函数来实现语义保留，并以公开数据集 CartoonSet 为基准来证明该方法的有效性。

Nov, 2017

针对代表不足音乐生成的迁移学习

本文研究了组合创意方法来进行迁移学习，以提高基于深度神经网络的模型在非分布式体裁（OOD）音乐生成方面的性能。我们以伊朗民俗音乐为例，使用组合创意迁移学习方法，成功地调整了 MusicVAE（一个大型生成音乐模型）适应伊朗民俗音乐数据集。结果表明，未来该方法有潜力用于生成代表性不足的音乐类型。

Jun, 2023

从 A 到 Z: 深度神经网络生成器的监督式风格和内容转移

提出了一种新的神经网络结构来解决单张图像类比的问题，我们的网络是一个修改后的变分自编码器（VAE），支持有监督的训练和结构相似性目标的输出评估，通过对于 62 个字体从单个样例字母的生成展示出比现有技术更优异的结果。

Mar, 2016

用于多对多音色转换的调制变分自编码器

本文介绍了使用 Modulated Variational auto-Encoders (MoVE) 在音乐中实现 timbre transfer 的方法，通过使用 Feature-wise Linear Modulation (FiLM) 和 Maximun Mean Discrepancy 减少对抗网络的需要，最终实现了 multi-domain transfer。

Sep, 2018