Oct, 2022

基于情境适配器和自适应增强的 CTC 语音识别模型个性化研究

TL;DR该研究提出了一种新的语音识别模型,使用动态增强和电话对齐网络来优化编码器和解码器,在编码器中引入关注稀有单词和超出词汇表以及解码器中使用子词预测结果,结果表明 F1 可以达到 60%。