MIDI至谱:通过遮蔽语言模型推测吉他谱
该研究使用 BERT 的掩蔽语言建模方法尝试预训练一个12层Transformer模型,用于处理4166个多音乐器 MIDI 文件,以解决一些基于符号领域的音乐理解任务,并发现预训练仍然有效。
Jul, 2021
本文章介绍了DadaGP,这是一个全新的符号音乐数据集,包括26,181首GuitarPro格式的歌曲,涵盖739种音乐流派,以及一个适用于生成序列模型(如Transformer)的令牌格式。使用DadaGP可以训练吉他谱生成器、创建新的音乐风格、音乐风格转移和艺术家/流派分类等用例。
Jul, 2021
本文介绍如何使用深度学习技术创造出吉他Tablature格式的音乐,实现了基于乐器和音乐风格的控制,证明在生成吉他专业音乐方面的相对效果。
Feb, 2023
本文研究吉他谱表中弯音的出现预测,通过对弯音的过去和未来短期上下文的分析,提出了一套25个高级特征,并在流行音乐的932个主音吉他谱表上进行了实验,成功地通过决策树预测了弯音的发生,同时有限地减少了误报率,证明了将非吉他音乐排列成吉他谱表的有前景的应用。
Aug, 2023
应用深度学习技术对符号音乐进行理解的第一步是将音乐作品(主要是MIDI格式)转换为预定义令牌的序列,如音符音高、音符速度和和弦。然后,将这些序列输入神经序列模型以完成特定任务。在本文中,我们提出了一种新的方法——NG-Midiformer,用于理解符号音乐序列,该方法利用了N-gram方法。我们的方法首先使用我们提出的无监督复合法将音乐作品处理成类似单词的序列,然后使用我们的N-gram Transformer编码器,该编码器能够有效地融合N-gram信息,以增强用于更好理解音乐序列的主要编码器部分。大规模音乐数据集上的预训练过程使模型能够深入学习包含在音乐序列中的N-gram信息,并在微调阶段应用此信息进行推理。实验证明了我们方法的有效性,并在一系列音乐理解下游任务中实现了最先进的性能。
Dec, 2023
通过使用定制化的输入表示方法,我们提出了一种表达丰富的声学吉他声音合成模型,该模型名为guitarroll。通过扩散外推生成长期一致性的音频,我们的模型在音频质量方面优于基线模型,并比以前的主要工作生成更真实的音色声音。
Jan, 2024
提出了一种系统,能够从简单的 MIDI 旋律中生成由指法、演奏技巧以及表现技巧丰富的谱表,并通过解决受约束的多属性优化问题,推导出最佳的品举位置,而不仅仅考虑每一刻所用的手指;然后,通过分析 mySongBook 语料库的统计数据,引入最常见的套路和生物力学可行性、演奏技巧以及表现技巧;最后,将得到的输出转换为 MusicXML 格式,以便于可视化和使用。所得到的谱表质量以及这种方法的高可配置性在教学、辅助作曲与编曲以及计算性表现音乐模型等领域可能产生多重影响。
Jul, 2024
本研究解决了如何有效利用预训练的大型音乐语言模型进行可控音乐编排的挑战。我们提出了一种统一的序列到序列框架,使符号音乐语言模型能够在多种编排任务中进行微调,显著提高了音乐质量。这一工作不仅拓宽了音乐生成的应用范围,还证明了预训练阶段为模型提供了理解音乐条件的关键知识。
Aug, 2024
本研究解决了从视频输入自动生成吉他谱的难题,提升了音乐教育、转录准确性和表演分析。通过深度学习和傅里叶变换音频分析,本文提出了一种先进的方法,显著提高了音符识别的准确性和鲁棒性,潜在地改变了吉他教学的方式。
Sep, 2024