Jan, 2023

基于双向上下文的连续语音识别新标点技术

TL;DR本文提出一种基于流式处理的自动标点系统,使用动态解码窗口对 ASR 识别结果进行标点或重新标点,并检测其对标点和分割准确性的影响。实验结果表明,该方法能够有效解决过分割问题,提高 13.9% 的分割 F0.5 评分,并使机器翻译任务的 BLEU 分数平均提高 0.66。