May, 2023
双向语言模型在语义分割中改善长篇语音识别
Semantic Segmentation with Bidirectional Language Models Improves Long-form ASR
W. Ronny Huang, Hao Zhang, Shankar Kumar, Shuo-yiin Chang, Tara N. Sainath
TL;DR通过从语言模型中提炼标点符号知识,并将其应用于分割长篇语音,我们研究出一种优于其他方法的,实现了 3.2% 相对词错误率增益以及 60ms 中位端到端延迟降低的流式自动语音识别管道分割器。