Jul, 2023

低资源设备上的关键词检测中的在线连续学习通过高阶时序统计的池化

TL;DR嵌入式设备上的关键词检测模型需要快速适应新用户定义的词汇,同时不会遗忘之前的词汇。为此,我们提出了一种新的方法 ——Temporal Aware Pooling (TAP),用于构建丰富的特征空间,通过计算预先训练主干架构提取的语音特征的高阶矩。我们的方法,TAP-SLDA,在实验分析中在多个设置、主干架构和基准测试中表现优异,在 GSC 数据集上相对平均增益达到 11.3%。