Mar, 2024
VoxGenesis:无监督发现语音合成的潜在说话人流形
VoxGenesis: Unsupervised Discovery of Latent Speaker Manifold for Speech Synthesis
Weiwei Lin, Chenhang He, Man-Wai Mak, Jiachen Lian, Kong Aik Lee
TL;DR提出了一种无监督的语音合成框架 VoxGenesis,通过探索潜在空间,发现与特定说话者特征相关的可解释方向,实现对声音的编辑,并生成更具多样性和真实性的说话者。