我们提出了将扩散模型与生成对抗网络相结合的方法,旨在解决算法音乐生成中的情感控制和计算成本的问题。通过训练变分自编码器得到情感标签的符号音乐数据集的嵌入,并用其来训练扩散模型,我们成功地控制了扩散模型以生成具有特定情感的符号音乐,同时大幅提升了计算效率。
Oct, 2023
本文提出了三个基于生成对抗网络的符号化多轨音乐生成模型,并通过客观和主观的评估方法证明了这些模型的有效性。此外,该文还介绍了一些评估生成结果的标准,并通过与人类协作音乐生成的实验进行探讨。
Sep, 2017
本文提出了一种基于预训练变分自编码器的离散领域参数化的扩散模型训练技术,用于离散和连续领域的生成导致更优结果,并在应用于符号音乐领域时表现出很强的无条件生成和条件填充结果,相比基于自回归语言模型的连续嵌入操作更具可行性。
Mar, 2021
通过将矢量量化变分自编码器(VQ-VAE)与离散扩散模型结合,我们提出了一种生成具有目标作曲家风格的符号音乐的方法,结果表明,我们的模型在满足给定条件的情况下以 72.36% 的高准确率生成符号音乐。
本文提出了一种名为 Gated GAN 的多样式图像合成模型,该模型结合了编码器,门控变换器和解码器三个部分,可以实现在一个模型中转换多种样式的输入图像,同时通过辅助分类器识别样式类别,以稳定训练并提高合成图像质量。
Apr, 2019
使用转移学习解决 Jazz 音乐中数据不足和乐曲自动生成的问题。实验使用两种转移学习方法,其中添加流派标签和使用流派分类器的模型比单独使用 Jazz 数据集更好,但不能充分利用流派不指定的数据集。
Aug, 2019
本文提出了一种名为 XGAN 的双对抗自编码器,可以无监督地捕捉共同的领域语义内容,同时在两个方向上学习域与域之间的图像转换,并通过语义一致性损失函数来实现语义保留,并以公开数据集 CartoonSet 为基准来证明该方法的有效性。
Nov, 2017
本文研究了组合创意方法来进行迁移学习,以提高基于深度神经网络的模型在非分布式体裁(OOD)音乐生成方面的性能。我们以伊朗民俗音乐为例,使用组合创意迁移学习方法,成功地调整了 MusicVAE(一个大型生成音乐模型)适应伊朗民俗音乐数据集。结果表明,未来该方法有潜力用于生成代表性不足的音乐类型。
Jun, 2023
提出了一种新的神经网络结构来解决单张图像类比的问题,我们的网络是一个修改后的变分自编码器(VAE),支持有监督的训练和结构相似性目标的输出评估,通过对于 62 个字体从单个样例字母的生成展示出比现有技术更优异的结果。
Mar, 2016
本文介绍了使用 Modulated Variational auto-Encoders (MoVE) 在音乐中实现 timbre transfer 的方法,通过使用 Feature-wise Linear Modulation (FiLM) 和 Maximun Mean Discrepancy 减少对抗网络的需要,最终实现了 multi-domain transfer。
Sep, 2018