Jan, 2023

改进和分析用于 ASR 的神经说话人嵌入

TL;DR本文研究了将神经说话者嵌入用于一个 ASR 系统,并通过基于 Conformer 的混合 HMM ASR 系统,在使用加权简单加法(Weighted-Simple-Add)集成方法时,展示了改进的嵌入提取流程,通过比较和分析不同的说话者嵌入来获得声学模型的改进,最终将最佳的 Conformer-based 混合 ASR 系统与说话者嵌入结合起来,获得了 9.0%的 WER 并在 Hub5'00 和 Hub5'01 上进行训练。