Feb, 2024

探究神经网络语音模型中自动语音识别系统所编码的信息

TL;DR通过神经网络的层级表达,在多个任务中评估自动语音识别声学模型的性能变化和目标任务,我们可以推测哪些信息在不同层次的架构步骤中得到强化或干扰。分析结果显示,基于神经网络的声学模型拥有异质信息,似乎与音素识别没有相关性,例如情感、情绪或说话人身份,而低层隐藏层总体上对信息结构有用,而上层则倾向于删除对音素识别无用的信息。