Sep, 2023

使用无旋律监督预训练提升单音人声合成的音域

TL;DR基于先前的研究,在一个多歌手的数据集上进行的旋律无监督多说话人预训练方法,提高了单个说话人的声域,同时不降低音色相似性。这种预训练方法可以应用于只包含音频和歌词对的大规模多歌手数据集,并改善了合成歌声的音质和节奏自然度。