MIDI至谱：通过遮蔽语言模型推测吉他谱

Aug, 2024

MIDI至谱：通过遮蔽语言模型推测吉他谱

MIDI-to-Tab: Guitar Tablature Inference via Masked Language Modeling

Drew Edwards, Xavier Riley, Pedro Sarmento, Simon Dixon

TL;DR本文解决了从符号音乐表示生成吉他谱的问题，采用了新的深度学习方法。研究介绍了一种基于变换器的编码-解码模型，通过遮蔽语言建模将音符分配到吉他弦上，经过评估显示该模型在吉他谱的可演奏性评分上显著超越了现有算法。

Abstract

Guitar tablatures enrich the structure of traditional music notation by assigning each note to a string and fret of a guitar in a particular tuning, indicating precisely where to play the note on the instrument. The problem of generating tablature from a symbolic music representation involves inferring this string and fret assignment per note across an entir

发现论文，激发创造

MidiBERT-Piano: 大规模符号音乐理解的预训练

该研究使用 BERT 的掩蔽语言建模方法尝试预训练一个12层Transformer模型，用于处理4166个多音乐器 MIDI 文件，以解决一些基于符号领域的音乐理解任务，并发现预训练仍然有效。

Jul, 2021

DadaGP: 用于序列模型的分词 GuitarPro 歌曲数据集

本文章介绍了DadaGP，这是一个全新的符号音乐数据集，包括26,181首GuitarPro格式的歌曲，涵盖739种音乐流派，以及一个适用于生成序列模型（如Transformer）的令牌格式。使用DadaGP可以训练吉他谱生成器、创建新的音乐风格、音乐风格转移和艺术家/流派分类等用例。

Jul, 2021

GTR-CTRL: 基于Transformer的吉他音乐生成中的乐器和类型调节

本文介绍如何使用深度学习技术创造出吉他Tablature格式的音乐，实现了基于乐器和音乐风格的控制，证明在生成吉他专业音乐方面的相对效果。

Feb, 2023

流行音乐吉他谱的弯曲建模

本文研究吉他谱表中弯音的出现预测，通过对弯音的过去和未来短期上下文的分析，提出了一套25个高级特征，并在流行音乐的932个主音吉他谱表上进行了实验，成功地通过决策树预测了弯音的发生，同时有限地减少了误报率，证明了将非吉他音乐排列成吉他谱表的有前景的应用。

Aug, 2023

N-Gram无监督复合和特征注入以提升符号音乐理解能力

应用深度学习技术对符号音乐进行理解的第一步是将音乐作品（主要是MIDI格式）转换为预定义令牌的序列，如音符音高、音符速度和和弦。然后，将这些序列输入神经序列模型以完成特定任务。在本文中，我们提出了一种新的方法——NG-Midiformer，用于理解符号音乐序列，该方法利用了N-gram方法。我们的方法首先使用我们提出的无监督复合法将音乐作品处理成类似单词的序列，然后使用我们的N-gram Transformer编码器，该编码器能够有效地融合N-gram信息，以增强用于更好理解音乐序列的主要编码器部分。大规模音乐数据集上的预训练过程使模型能够深入学习包含在音乐序列中的N-gram信息，并在微调阶段应用此信息进行推理。实验证明了我们方法的有效性，并在一系列音乐理解下游任务中实现了最先进的性能。

Dec, 2023

一种具有乐器特定输入表示和扩散绘制的表达性声学吉他声音合成

通过使用定制化的输入表示方法，我们提出了一种表达丰富的声学吉他声音合成模型，该模型名为guitarroll。通过扩散外推生成长期一致性的音频，我们的模型在音频质量方面优于基线模型，并比以前的主要工作生成更真实的音色声音。

Jan, 2024

高分辨率吉他转录通过领域适应

使用高分辨率钢琴转录模型训练新的吉他转录模型，从而在零样本情况下在GuitarSet上获得最先进的转录结果，改进了之前发表的方法。

Feb, 2024

由MIDI到丰富的谱表：一种考虑主音吉他手指的变动和风格选择的自动生成系统

提出了一种系统，能够从简单的 MIDI 旋律中生成由指法、演奏技巧以及表现技巧丰富的谱表，并通过解决受约束的多属性优化问题，推导出最佳的品举位置，而不仅仅考虑每一刻所用的手指；然后，通过分析 mySongBook 语料库的统计数据，引入最常见的套路和生物力学可行性、演奏技巧以及表现技巧；最后，将得到的输出转换为 MusicXML 格式，以便于可视化和使用。所得到的谱表质量以及这种方法的高可配置性在教学、辅助作曲与编曲以及计算性表现音乐模型等领域可能产生多重影响。

Jul, 2024

解锁预训练音乐语言模型的潜力以实现多轨音乐编排的多功能性

本研究解决了如何有效利用预训练的大型音乐语言模型进行可控音乐编排的挑战。我们提出了一种统一的序列到序列框架，使符号音乐语言模型能够在多种编排任务中进行微调，显著提高了音乐质量。这一工作不仅拓宽了音乐生成的应用范围，还证明了预训练阶段为模型提供了理解音乐条件的关键知识。

Aug, 2024

TapToTab：基于视频的吉他谱生成与人工智能和音频分析

本研究解决了从视频输入自动生成吉他谱的难题，提升了音乐教育、转录准确性和表演分析。通过深度学习和傅里叶变换音频分析，本文提出了一种先进的方法，显著提高了音符识别的准确性和鲁棒性，潜在地改变了吉他教学的方式。

Sep, 2024