Mar, 2024

VoxGenesis:无监督发现语音合成的潜在说话人流形

TL;DR提出了一种无监督的语音合成框架 VoxGenesis,通过探索潜在空间,发现与特定说话者特征相关的可解释方向,实现对声音的编辑,并生成更具多样性和真实性的说话者。