Nov, 2024

重新思考MUSHRA:应对文本到语音评估的现代挑战

TL;DR这项研究解决了当前文本到语音(TTS)评估中缺乏一致和稳健的人类评估框架的问题。论文提出了两种改进的MUSHRA测试变体,分别解决了参考匹配偏差和评判模糊性的问题,从而实现了对超越人类语音质量的TTS系统的更公正和清晰的评分。此外,研究还发表了MANGO数据集,包含47,100个汉语和泰米尔语的人类评分,为分析人类偏好和开发自动评估指标提供了支持。