Feb, 2023

利用支持性文本数据启动有限转录的自动语音识别系统开发

TL;DR本文研究发现,使用不同数量的文本数据进行训练和 fine-tune transformer model 可以降低自动语音识别(ASR)的 word error rate,其中 lexicon 对于改善 ASR 性能没有多大作用,而使用必要量的文本数据可以通过利用自然语言处理技术使自动语音识别接近人类的水平。