Apr, 2025

基于听觉感知的合成语音MOS预测模型(APG-MOS)

TL;DR本研究针对自动语音质量评估中的主观感知模型不足的问题,提出了一种新的听觉感知导向的MOS预测模型(APG-MOS)。该模型通过整合生物听觉机制与语义分析,提高了与人类判断的一致性,实验结果显示其在主要基准上的表现优于现有模型,具有显著的影响潜力。