Apr, 2023

ArmanTTS 波斯语单说话人数据集

TL;DR本文介绍了单人发音数据集 ArmanTTS,通过对比各种普遍数据集的特征,证明了 ArmanTTS 是教授波斯文本到语音转换模型所必需的标准。我们结合 Tacotron 2 和 HiFi GAN 设计了一个模型,可以接收音素作为输入,输出是相应的语音合成,并获得了 MOS 评分分别为实际语音的值为 4.0、音频编解码器预测的值为 3.87 和 TTS 模型生成的合成语音的值为 2.98。