Aug, 2024

印度经典音乐中的旋律声线分层生成建模

TL;DR本研究解决了之前生成模型未能捕捉印度音乐演唱中旋律丰富性的不足问题。我们提出了一种名为GaMaDHaNi的模块化两级层次结构,通过精细量化的音高轮廓作为中介表示,来改善音频建模的效果。研究结果表明,使用音高轮廓作为中介表示可以提升人机协作的交互能力,为音乐生成和音高调节提供新的应用案例。