Oct, 2020

面向唤醒词检测的数据有效建模

TL;DR本研究提供了一种数据高效的跨领域唤醒词模型训练技术,该技术包括多种声学环境的训练管道和半监督学习管道,可以用 10 个小时的领域不匹配的音频来增强模型鲁棒性,并从未经译写的语音语料库中准确提取 WW 和可能相似的例子,所提出的解决方案可节省 97%的具体 WW 数据收集和 86%的注释带宽并达到产业级模型的可比性能。