Jun, 2023

语音表示的 MOS 预测评估

TL;DR该研究评估了预测语音质量的特征提取模型,并提出了一种模型架构,用于比较有监督学习和自监督学习模型的嵌入和说话人验证模型的嵌入以预测指标 MOS;实验结果在 VCC2018 数据集和一个叫做 BRSpeechMOS 的巴西 - 葡萄牙语数据集中均表明,译为 “耳语模型” 在所有情境下都是适当的。