Jun, 2024

一种用于上下文化普通话语音识别的高效文本增强方法

TL;DR使用简单的文本增强技术借助大量纯文本数据集来构建编码簿,可以提高预训练的 ASR 模型的上下文信息,从而显著提升识别性能。