May, 2020

移动设备上的流式关键词识别

TL;DR本文研究了关键词检测模型在流媒体和非流媒体模式下在移动手机上的延迟和准确性,并通过设计了一个基于 Tensorflow/Keras 的库自动将非流媒体模型转换为流媒体模型,从而减少了手动模型重写的工作量。作者使用该库对多个关键词检测模型在流和非流媒体模式下进行了基准测试,并展示了延迟和准确性之间不同的权衡。作者还探讨了使用多头注意力的新型 KWS 模型,在 Google 语音命令数据集 V2 上将分类误差降低了 10%。最后,作者开源了流媒体库和所有实验的代码。