Sep, 2022

解决 OOV 问题的发音流水线的优良性

TL;DR通过使用 ASR 系统的不同组件评估口音并自动评估它们,我们提出了一种解决测试时开放式语音识别系统中的 OOV 问题的 GoP 计算的流水线,并且通过构建三个管道来实现去除 GoP 输出中的 UNK 和 SPN 音素,Online、Offline 和 Hybrid 管道,以扩展词库以及对每个 utterance 进行处理,最终提供 Phoneme to posterior mappings、每个 utterance 的 GoP 得分向量以及 GoP 流程中使用的 Word boundaries 等实用工具供未来研究使用。