Oct, 2023

两阶段多分辨率集成的稳健唤醒词检测

TL;DR通过增强数据的时间对齐性和使用基于两个分辨率阶段的检测,本研究提出了一种声控界面的优化方案,包括轻量级即时处理音频流的设备端模型和云端验证模型。在隐私保护方面,该方案将音频特征发送到云端而非原始音频,且在各噪声条件下,所提出的模型优于更强的分类器。