Apr, 2024

为瑞典自动语音识别系统开发声学模型

TL;DR本研究旨在通过训练系统实现自动持续语音识别,并以瑞典口语为例,使用隐藏马尔可夫模型,利用 SpeechDat 数据库进行参数训练。在这项研究中,声学建模在语音识别应用方面具有一定的普适性,尽管对模型评估仅考虑了一个简化的任务(数字和自然数识别)。研究还测试了不同类型的音素模型,包括独立上下文模型和两种上下文相关模型的变体。同时,还进行了多个使用双字语言模型调整系统参数的实验。研究还检查了在不同说话者子集(性别、年龄和方言)上系统性能的情况,并将结果与先前类似研究进行了对比,显示出明显的改进。