Nov, 2023

探索用于生成音乐可解释人工智能的变分自动编码器结构、配置和数据集

TL;DR这篇论文通过对不同组合的 Variational Auto-Encoder 模型、AI 模型的潜在空间配置和训练数据集进行系统研究,表明 MeasureVAE 在音乐生成性能方面具有更好的重构表现,AdversarialVAE 在音乐属性独立性方面表现更好。结果展示了 MeasureVAE 能够通过可解释的音乐控制维度生成跨音乐流派的音乐,并且在生成简单的流行和摇滚音乐时表现最佳。建议在使用 MeasureVAE 生成跨流派音乐时,4 个正则化维度的 32 或 64 个潜在空间尺寸是最佳选择。这些结果是关于音乐生成的最详细的现代生成 AI 模型配置的比较,并可用于选择和配置 AI 模型、音乐特征和数据集以实现更易理解的音乐生成。