Feb, 2022

使用光谱时域深度特征进行言语适应,在语音识别中应用于发音困难和老年人

TL;DR该研究提出了一种基于频谱分解的深度特征提取方法,用于通过个性化的演讲者自适应技术提高自动语音识别系统对肌肉发音障碍者和老年人的识别准确率。通过在四项任务中的实验表明,在应用该技术后,识别准确率有了显著的提高。