使用图神经网络对古典音乐符号的节奏检测
本研究提出了三种方法,其中两种是基于图形的新颖算法,通过形式或结构对符号音乐进行分割。使用两个公共数据集对其进行了消融研究,发现使用图形表示对结构进行符号音乐编码,并计算从图中获取的邻接矩阵的新颖性可以很好地表示符号音乐的结构,同时无需提取其特征。我们成功实现了在线无监督变点检测方法,F_1 值为 0.5640,容忍间隔为 1 拍,本研究希望这些方法能用于改进其他音乐信息检索任务。
Mar, 2023
提出了一种符号音乐生成模型,使用了歌曲结构图分析网络构建了一个图,利用音符序列和乐器等信息作为节点特征,音符序列之间的相关性作为边特征。通过训练图神经网络来获取图中节点的表示,然后将节点表示作为 Unet 的输入生成 CONLON 钢琴滚动图像潜变量。实验结果表明,该模型可以生成全面形式的音乐,为符号音乐生成提供了一种有前景且创新的方法,并在音乐信息检索的各个领域,包括音乐创作、音乐分类和音乐修复系统中具有潜在的应用价值。
Dec, 2023
我们提出了一种新的图卷积块,称为 MusGConv,专门为高效处理音乐乐谱数据而设计,并根据一般感知原理进行了激发。它关注音乐的两个基本维度,音高和节奏,并考虑了这些组成部分的相对和绝对表示。我们在四个不同的音乐理解问题上评估了我们的方法:单声部分离、和声分析、乐句检测和作曲家识别,这在抽象术语中转化为不同的图学习问题,即节点分类、链接预测和图分类。我们的实验证明了 MusGConv 在以上三个任务上改善了性能,同时概念上非常简单和高效。我们解释这一结果是证据表明,在开发音乐乐谱数据的图网络应用时,包括基本音乐概念的感知驱动处理是有益的。
May, 2024
本研究探讨了在给定和弦进行约束下解决旋律生成问题的方法,并比较了 LSTM(一种 RNN)和 WaveNet(扩张时间 - CNN)两种序列生成模型,结果显示使用扩张卷积层更显式地编码结构可以显著提高性能,而将基础和弦进行全局编码则更有提升效果。
Nov, 2018
本文提出了基于组成层次结构实现完整音乐作品建模的方法,通过定义一种分层语言对流行歌曲的符号化表示进行建模。通过级联扩散模型训练了分层语言模型,实验证明该模型能够生成具有可识别的全局歌词 - 副歌结构和协调音的完整音乐作品,且音乐质量高于基准模型。此外,还展示了该模型具有灵活的可控性,用户可以通过从可解释的分层语言中采样或调整预训练的外部表示来控制音乐的流动。
May, 2024
本文介绍一种基于符号和弦标注的新型音乐分割方法,即 pitchclass2vec,使用自然语言处理技术和定制编码将其嵌入到连续的向量表示中。使用 LSTM 神经网络的算法,在音乐领域优于基于符号和弦注释的最新技术。
Mar, 2023
本文提出了一种数据驱动的框架,以将音乐序列 解析为依赖树,该系统不依赖于任何特定的符号语法,可以同时考虑多种音乐特征,并利用序列上下文信息,可以轻松集成到现代深度学习管道中。在两个音乐数据集上测试表明,该方法优于先前的方法。
Jun, 2023
本文提出一种基于卷积神经网络的生成式对抗网络 MidiNet,用于在符号域中生成旋律,其能够通过先前的和弦序列或前几小节的旋律生成新的旋律,相比 MelodyRNN 模型表现更为出色。
Mar, 2017