In recent years, deep convolutional neural networks have achieved state of
the art performance in various computer vision task such as classification,
detection or segmentation. Due to their outstanding performan
本研究采用深度残差学习和扩张卷积探索了关键词检测任务的应用,使用 Google Speech Commands 数据集作为基准。我们的最佳残差网络实现在准确性方面明显优于 Google 以前的卷积神经网络。通編变化模型深度和宽度,我们可以实现比以前的小型脚本变体更优秀的紧凑型模型。据我们所知,我们是第一个研究这些方法的关键词检测任务的人,我们的结果建立了一个开源的最新参考来支持未来基于语音的接口的开发。