Jan, 2023
改进和分析用于 ASR 的神经说话人嵌入
Improving And Analyzing Neural Speaker Embeddings for ASR
Christoph Lüscher, Jingjing Xu, Mohammad Zeineldeen, Ralf Schlüter, Hermann Ney
TL;DR本文研究了将神经说话者嵌入用于一个 ASR 系统,并通过基于 Conformer 的混合 HMM ASR 系统,在使用加权简单加法(Weighted-Simple-Add)集成方法时,展示了改进的嵌入提取流程,通过比较和分析不同的说话者嵌入来获得声学模型的改进,最终将最佳的 Conformer-based 混合 ASR 系统与说话者嵌入结合起来,获得了 9.0%的 WER 并在 Hub5'00 和 Hub5'01 上进行训练。