Feb, 2024

BASE TTS:基于 100K 小时数据构建亿参数的文本转语音模型的经验教训

TL;DR我们介绍了一个名为 BASE TTS 的文本转语音 (TTS) 模型,它是迄今为止最大的 TTS 模型,以 100K 小时的公共领域语音数据进行训练,在语音自然度方面取得了最新的最佳效果。