Sep, 2023

格网句与自然句对正常音量转化效果的比较研究

TL;DR这篇论文通过对《Lombard Chinese TIMIT (LCT)》和《Enhanced MAndarin Lombard Grid corpus (EMALG)》的比较,研究了格状句对于提高自然语音可懂性的效果以及通过参数分析发现了噪音水平的增加使得格状句和自然句都表现出类似的变化,但是在alpha比率的增加方面,格状句呈现出更大的增长,最后通过主观可懂性评估发现在性别和信噪比方面,EMALG上训练的StarGAN模型在提高可懂性方面始终优于LCT上训练的模型,这种优越的表现可能归因于EMALG中从正常语音到Lombard语音的alpha比率增长更大。