Jun, 2024

ControlSpeech: 实现解耦编解码器的零样本复制和零样本语言风格控制的同时处理

TL;DR控制语音 (ControlSpeech) 是一个文本到语音系统,能够完全克隆说话者的声音,并且可以根据几秒钟的音频提示和简单的文本风格描述提示进行任意控制和调整。