Jan, 2023
基于双向上下文的连续语音识别新标点技术
Streaming Punctuation: A Novel Punctuation Technique Leveraging Bidirectional Context for Continuous Speech Recognition
Piyush Behre, Sharman Tan, Padma Varadharajan, Shuangyu Chang
TL;DR本文提出一种基于流式处理的自动标点系统,使用动态解码窗口对 ASR 识别结果进行标点或重新标点,并检测其对标点和分割准确性的影响。实验结果表明,该方法能够有效解决过分割问题,提高 13.9% 的分割 F0.5 评分,并使机器翻译任务的 BLEU 分数平均提高 0.66。