Jul, 2023

VITS2: 用对抗学习和架构设计提高单阶段文本转语音的质量和效率

TL;DR通过改进结构和训练机制,提出的 VITS2 单阶段文本转语音模型在自然度、多说话人模型的语音特征相似性以及训练和推断的效率方面取得了显著改进,并且成功减少了对音素转换的强依赖,实现了完全的端到端单阶段方法。