Jan, 2024

具有强延迟约束的连接主义语音识别的动态行为

TL;DR本文描述了在具有严格延迟限制的语音语调识别中使用连接主义技术的方法。通过将语音信号输入到关节合成器中,从而实时产生一个合成脸部的嘴唇运动。在不同的延迟条件下,研究了多层感知器学习的时间演化模型与维特比译码器所施加的转移模型之间的相互作用。通过控制语言模型中的时间依赖关系参数进行了两个实验。结果表明神经网络拓扑结构、语言模型中时间依赖关系的长度以及译码器延迟之间存在强烈的相互作用。