Jun, 2024

MakeSinger: 一种用于数据高效的半监督训练方法的歌声合成,通过无分类器扩散引导

TL;DR通过无分类器扩散引导的 MakeSinger 半监督训练方法,提高合成的歌声质量,并展示即使在无歌声数据的情况下,通过训练文字转语音 (TTS) 数据的模型仍可以合成 TTS 说话者的歌声。