- AAAIN-Gram 无监督复合和特征注入以提升符号音乐理解能力
应用深度学习技术对符号音乐进行理解的第一步是将音乐作品(主要是 MIDI 格式)转换为预定义令牌的序列,如音符音高、音符速度和和弦。然后,将这些序列输入神经序列模型以完成特定任务。在本文中,我们提出了一种新的方法 ——NG-Midiform - miditok: 一个用于 MIDI 文件分词的 Python 软件包
近期自然语言处理进展中,语言模型如 Transformers 已被应用于符号音乐,可用于音乐生成、建模或转录,拥有最先进的性能。为了对骨干模型进行音乐编码和解码,需要依赖于令牌化器,其作用是将音乐序列化为称为令牌的不同元素序列。MidiTo - 情绪控制下的快速扩散生成对抗网络模型用于符号音乐生成
我们提出了将扩散模型与生成对抗网络相结合的方法,旨在解决算法音乐生成中的情感控制和计算成本的问题。通过训练变分自编码器得到情感标签的符号音乐数据集的嵌入,并用其来训练扩散模型,我们成功地控制了扩散模型以生成具有特定情感的符号音乐,同时大幅提 - 使用向量量化离散扩散模型进行特定作曲家风格的符号音乐生成
通过将矢量量化变分自编码器(VQ-VAE)与离散扩散模型结合,我们提出了一种生成具有目标作曲家风格的符号音乐的方法,结果表明,我们的模型在满足给定条件的情况下以 72.36% 的高准确率生成符号音乐。
- 时间和音符时长的分词对深度学习的符号音乐建模的影响
本研究分析了常见的符号化音乐分词方法以及时间和音符长度表示对深度学习模型性能的影响,并通过多个任务的比较展示了直接信息在不同任务中提供更好的结果。
- 运用图神经网络进行罗马数字分析:从音符特征的角度进行节拍预测
提出了一种基于图神经网络(GNN)的新方法,该方法通过直接描述和处理乐谱中的每个音符,利用音符特征和音符之间的相互依赖性来进行 Roman Numeral 分析,该方法在参考数据集上实现了更高的准确性,并探索了使用 NADE 和后处理等技术 - MuseCoco:从文本生成符号音乐
本文介绍了 MuseCoco,一种从文本描述中生成符号音乐的方法,通过将任务分解为文本到属性理解和属性到音乐生成阶段,并提供几种控制选项,使得音乐生成更具数据效率和精准控制性。
- IJCAI离散扩散概率模型用于符号音乐生成
本文提出了一种使用 Discrete DDPMs (D3PMs) 直接生成 Polyphonic Symbolic Music 的方法,并展示了该模型的高质量和灵活的属性,并警示无法通过量化指标完全评估样本质量。
- MMLooPy:一种友好的混合框架,用于电子舞曲音乐信息检索的研究
本研究介绍了一种基于 Python 的电子舞曲音频生成、深度学习技术和符号音乐的自动化结构,可用于 MIR 的 EDM 歌曲,以缓解获取标注数据的难度。研究表明,我们的混音可以在主观和客观标准上达到与世界知名艺术家制作的参考歌曲相同的质量。
- IJCAI将音乐声音分离视为关联预测问题:将一个音乐感知任务建模为多轨迹跟踪问题
这篇论文采用图神经网络,将声音分离问题建模为多轨迹跟踪问题,利用离散观察中的多音符信息实现对音乐的分解处理,使用新的正则化损失函数得到了最新的分离结果。
- 从单词到音乐:符号音乐生成中子词分词技术的研究
本文研究了在符号音乐生成中,应用子词分词技术(如 Byte-pair Encoding)对生成歌曲结构和长度的影响,以及与音乐生成质量指标(如结构指标,Pitch Class Entropy 等)之间的关系。结果表明子词分词技术有望改善符号 - 基于图形表示和变点检测方法的符号音乐结构分析
本研究提出了三种方法,其中两种是基于图形的新颖算法,通过形式或结构对符号音乐进行分割。使用两个公共数据集对其进行了消融研究,发现使用图形表示对结构进行符号音乐编码,并计算从图中获取的邻接矩阵的新颖性可以很好地表示符号音乐的结构,同时无需提取 - AAAI一种基于领域知识启发的音乐嵌入空间和新型注意力机制,用于符号音乐模型
本文提出了基于具有偏置校正的正弦编码的基础音乐嵌入(FME)进行符号音乐嵌入的方法,在此基础上,使用相对 - 索引、音高和起始时间等嵌入提出了一种基于相对的关注机制(RIPO attention)进行符号音乐建模;实验结果表明,使用 RIP - AAAI探索预训练检查点在文本生成音乐任务中的功效
本研究首次尝试使用 BERT、GPT-2 和 BART 等公开可用的预训练模型生成完整且语义连贯的音乐曲谱,实验结果表明使用预训练检查点在文本到音乐生成任务中具有显著改进。
- 基于连续情感条件的符号音乐生成
本篇论文提出了一种新的方法用于生成多乐器符号音乐并能获得更高的情感表达,该方法利用了一个基于变换器的连续情感标签,同时,还提供了一个带有情感标签的大规模符号音乐数据集,并通过音符预测精度和情感平面的回归任务进行了数量化评估,结果表明我们的方 - FIGARO:以细粒度艺术控制生成符号音乐
本文提出了自监督的描述 - 序列生成任务,该任务可以在全局层次上精细地控制生成的序列,具有很强的推理偏差,并将高层级特征与领域知识相结合,在符号音乐生成方面实现了最先进的结果。
- 使用扩散模型生成符号音乐
本文提出了一种基于预训练变分自编码器的离散领域参数化的扩散模型训练技术,用于离散和连续领域的生成导致更优结果,并在应用于符号音乐领域时表现出很强的无条件生成和条件填充结果,相比基于自回归语言模型的连续嵌入操作更具可行性。
- 通过情感学习生成音乐
本文介绍了一个基于 Deep Learning 的生成模型,可用于自动根据所需情感生成音乐,并且可以用于标记音乐的情感分类,经实验证明,该模型的预测准确率较高。
- PiRhDy: 学习音符音乐的音高,节奏和动态感知嵌入
提出了一种名为 PiRhDy 的新框架,该框架将音高、节奏和动态信息无缝地整合在一起,并利用音乐的旋律和和声知识训练令牌嵌入,表现出对符号音乐的显着进步,并有潜力成为各种符号音乐应用程序的预训练工具。