Oct, 2022

JukeDrummer:基于 Transformer VQ-VAE 的有条件节拍感知音频域鼓伴奏生成

TL;DR本文提出一种使用 Transformer 模型在音频领域生成鼓声的方法,通过使用含有鼓声和不含鼓声的音轨进行训练,使用 VQ-VAE 进行音频编码,使用 Mel-spectrogram 进行鼓声编码,并且使用与输入音频相关的节拍特征,从而演奏出与输入音频节奏风格一致的鼓声。