本文提出了一种主观方法,通过向不同水平的用户询问与基本音乐原理相关的问题来评估基于 AI 的音乐作曲系统,以比较深度学习模型的最新发展情况,并给出了对于每个评估模型的每个用户水平的响应的结果。
Mar, 2022
通过提出轻量级的 Siamese 残差神经网络 (S-ResNN) 来自动识别音乐形态,并通过在钢琴音乐形态评估上的实验证明 S-ResNN 在精确率、召回率和 F1 得分方面明显优于其他基准方法。
Jan, 2024
通过研究训练数据的角度,本文通过在 MAESTRO 数据集的原始和重新执行版本上使用各种数据增强技术,获得了 MAPS 数据集的最新音符起始准确性,而无需查看其他的训练数据。
Feb, 2024
本文在三个数据集上对不同音乐标注模型进行一致的评估,并使用 ROC-AUC 和 PR-AUC 等常见评估指标提供参考结果,同时评估了模型的泛化能力。使用 PyTorch 提供预训练模型的实现,以保证可复制性。
Jun, 2020
提出了一种自动钢琴转录系统,该系统利用基于深度神经网络的多音高检测和基于统计模型的节奏量化相结合的方法提高了音乐信息处理的准确性,在系统性评估中发现一些全局特征误差较大,而由音乐知识推导的音高和节奏内容的非局部统计显著提高了转录结果的准确性。
Aug, 2020
探究如何利用卷积神经网络 (CNNs) 从对数 - 梅尔幅度谱图中有效地学习音色表示,提出了一种设计策略,旨在捕捉用于学习音质的相关时频上下文,并且设计了多个基于该策略的 CNN 体系结构。这些体系结构成功地应用于与音色相关的不同研究任务。
Mar, 2017
本研究调查了构建学习卷积网络用于乐器识别的问题,并对三种不同的权重共享策略进行了性能测试,结果表明混合三种卷积层在单个深度学习体系结构中的效果最佳。
May, 2016
本文提出了一种使用多层双向 Transformer 编码器重建钢琴演奏人类表现力的新方法,并使用现有的转录模型得到的转录乐谱来训练我们的模型,在此基础上通过控制采样过程中的钢琴家身份探索我们系统模拟不同钢琴家表现力差异的能力,在统计生成的表现力强的演奏和听力测试中对该系统进行评估,结果表明我们的方法实现了从转录分数生成类似于人类钢琴演奏的结果的最新技术水平,同时全面且一致地重建了人类的表现力,这进一步提出了挑战。
Jun, 2023
本文研究了使用最新的图像感知度量来评估音频信号的可行性,并通过将其表示为声谱图来进行评估。我们发现这种方法鼓励人们挖掘听觉和视觉通路的相似之处,并且还对一些基本度量进行了定制,以解决音频信号的特殊性。使用音乐数据集对自定义定制的度量和几个基线度量进行评估,并与人类评价者对音频质量的感知之间的相关性得出了令人满意的结果。
May, 2023
通过改进神经网络设计和模型大小,实现实时推断的钢琴转录模型,与现有最先进模型在音符精确度上相媲美并具有高性能及轻量级特点。
Apr, 2024