本文介绍了利用卷积神经网络进行自动乐器识别的应用。在这个模型中,特征提取和学习算法是通过端到端方式一起训练的。通过基于原始音频训练的卷积神经网络所取得的结果表明,其性能优于那些依赖手工制作特征的传统方法。
Nov, 2015
本篇论文讨论了针对乐器识别难题的注意力机制,并针对数据弱标签的问题,使得在 OpenMIC 数据集上的多标签乐器识别精度得到提升。
Jul, 2019
Timbre-Trap 是一个新型框架,通过利用音高和音色之间的强分离性,将音乐转录和音频重建相统一。我们通过训练一个 U-Net 模型,同时估计音高显著性和重建复杂谱系数,通过简单的切换机制在解码阶段选择其中之一的输出。我们证明了该框架的性能可与最先进的无特定乐器转录方法相媲美,而只需要少量的带注释数据。
Sep, 2023
本研究调查了构建学习卷积网络用于乐器识别的问题,并对三种不同的权重共享策略进行了性能测试,结果表明混合三种卷积层在单个深度学习体系结构中的效果最佳。
May, 2016
用深度卷积和递归神经网络来提高多声部钢琴音乐转录,在预测音符的开始和结束时间方面取得了相对 100% 的提升,并且通过预测标准化音频的相对速度得到更自然的转录结果。
Oct, 2017
本文探讨了基于帧的音乐转录的各种模型,重点在于达到人类录音的最新的方法。本文中讨论的具有平移不变性的网络,结合了传统的滤波器和卷积神经网络,在 2017 年 MIREX 多基频估计评估测试中成为最佳性能模型。本类模型在 log 频率域中共享参数,利用音乐的频率不变性来减少模型参数数量并避免对训练数据的过度拟合。本文中的所有模型都是通过 MusicNet 数据集中具有标记的数据进行监督训练的,并通过随机保持标签的音调变换进行增强。
Nov, 2017
本文介绍了一个新的大规模音乐数据集 MusicNet,旨在为音乐研究的机器学习方法提供监督和评估,该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成,其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。
Nov, 2016
本文提出了一种基于多尺度网络和自我关注机制的方法,将吉他演奏技巧检测问题定义为基于帧的多标签分类问题,应用于吉他演奏,有效地提取不同尺度的特征,并优于现有方法。
Mar, 2023
使用自监督学习模型对大规模未标记音乐数据进行预训练并在乐器演奏技术检测任务中进行微调,以解决数据稀缺和类别不平衡问题,通过辅助任务的多任务微调和事件级别预测的后处理方法,该方法在多个乐器演奏技术基准数据集上在帧级别和事件级别指标上均优于先前方法。
Oct, 2023
本文介绍了一种通过神经网络匹配短音频片段与乐谱中对应像素位置的方法。实验结果表明,使用深度学习技术处理音乐乐谱具有可行性且是一个有前途的研究方向。
Dec, 2016