Oct, 2023
两阶段多分辨率集成的稳健唤醒词检测
Robust Wake-Up Word Detection by Two-stage Multi-resolution Ensembles
Fernando López, Jordi Luque, Carlos Segura, Pablo Gómez
TL;DR通过增强数据的时间对齐性和使用基于两个分辨率阶段的检测,本研究提出了一种声控界面的优化方案,包括轻量级即时处理音频流的设备端模型和云端验证模型。在隐私保护方面,该方案将音频特征发送到云端而非原始音频,且在各噪声条件下,所提出的模型优于更强的分类器。