Nov, 2023

利用说话者信息个性化关键词检测

TL;DR通过整合说话者信息到关键词检测系统,使用 Feature-wise Linear Modulation(FiLM)方法从多个信息源进行学习,我们在多样化数据集上实验并取得了显著提高的关键词检测准确性,特别是在不平衡说话者群体中,还能在参数数量上只增加 1% 的情况下,最小程度影响延迟和计算成本,使其成为实际应用中的可行解决方案。