Jul, 2024

TTSDS -- 文本至语音分布评分

TL;DR我们提出了一种综合多个因素评估合成语音质量的方法,包括韵律、说话人身份和可懂性,在Benchamrk测试后发现我们的得分与人类评估具有强相关性。