Dec, 2022

用于端到端语音识别模型的文本适应的快速准确因式分解神经转录器

TL;DR介绍了因文本数据处理能力有限而提出的 FNT 模型及其在语音识别领域中的存在意义,并提出了多种方法来优化模型性能,使用这些方法后,相比于标准 FNT 模型,模型的错误率下降了 9.48%。