ACLMay, 2023

为实时语音搜索构建准确低延迟 ASR

TL;DR本文致力于开发一种精确的 LSTM,注意力 (Attention),和基于 CTC 的流式自动语音识别模型。这些模型针对印地英语 (Hinglish) 语音搜索应用,并分析了各种用于改进模型准确性的修改方法以及流媒体应用程序中的说话结束检测 (EOS) 的关键要求。该模型在 Flipkart 的语音搜索中获得了显着的性能提升,同时减少了搜索延迟。