面向唤醒词检测的数据有效建模

Oct, 2020

Towards Data-efficient Modeling for Wake Word Spotting

Yixin Gao, Yuriy Mishchenko, Anish Shah, Spyros Matsoukas, Shiv Vitaladevuni

TL;DR本研究提供了一种数据高效的跨领域唤醒词模型训练技术，该技术包括多种声学环境的训练管道和半监督学习管道，可以用 10 个小时的领域不匹配的音频来增强模型鲁棒性，并从未经译写的语音语料库中准确提取 WW 和可能相似的例子，所提出的解决方案可节省 97％的具体 WW 数据收集和 86％的注释带宽并达到产业级模型的可比性能。

Abstract

Wake word (WW) spotting is challenging in far-field not only because of the interference in signal transmission but also the complexity in acoustic environments. Traditional WW model training requires large amount of in-domain WW-specific data with substantial human annotations therefore it is hard to build WW models without such data. In this paper we prese

wake word spotting data-efficient solutions multi-condition training semi-supervised learning acoustic complexity

发现论文，激发创造

双重注意力神经传输器用于语音识别中高效唤醒词检测

该论文提出了双重注意力神经偏置结构，通过利用 Wake Words 来选择要执行的注意力网络分支，从而提高语音识别任务中的 Wake Words 识别准确性，节省运行时计算成本，并改善了其他方面的性能，同时降低了参数数量。

Apr, 2023

基于神经网络剪枝的迭代微调设计紧凑型视听唤醒词识别系统研究

本文提出了一种使用神经网络剪枝策略的紧凑型音视频唤醒词识别系统，该系统利用 MobileNet 对唇部信息进行编码，并与声学特征进行融合，大大提高了在不同噪声条件下的唤醒词识别性能，可望在电视开机场景下实现实际应用。

Feb, 2022

两阶段多分辨率集成的稳健唤醒词检测

通过增强数据的时间对齐性和使用基于两个分辨率阶段的检测，本研究提出了一种声控界面的优化方案，包括轻量级即时处理音频流的设备端模型和云端验证模型。在隐私保护方面，该方案将音频特征发送到云端而非原始音频，且在各噪声条件下，所提出的模型优于更强的分类器。

Oct, 2023

观察唤醒词：视听关键词检测

本研究提出一种名为 KWS-Net 的卷积神经网络结构，通过序列匹配和模式检测技术，从视觉角度自动检测并确定在何时，是否有包含关键词的口型出现，在无音频或有清晰 / 嘈杂语音的情况下，性能优于现有的同类方法，还在跨语言处理上实现了良好的表现。

Sep, 2020

分布偏移下的唤醒词检测

本文提出了一种半监督学习方法，它能够克服关键词检测任务中由于训练和实际数据之间分布偏移所引起的挑战，并且能够优化卷积神经网络以提高模型准确性。

Jul, 2022

使用有限和合成的语音数据训练关键词检测器

本文研究使用合成语音数据为小型的口语术语检测模型训练提取有用特征的预训练语音嵌入模型，相较于在 500 个真实示例上训练模型，只使用合成语音即可达到同等精度。

Jan, 2020

构建英语会话语音识别的具有竞争力的直接声学到单词模型

介绍了一个配方来训练一个 A2W 模型，以缩小与常规模型的差距，并呈现了一个联合单词 - 字符 A2W 模型，以提供富有意义的输出。

Dec, 2017

基于数据增强的针对播放干扰的关键词识别技术

本文提出了一种数据增强策略来提高在环境嘈杂的情况下关键词识别，通过利用不同的信号干扰比例和音频污染技术来降低虚警率，取得了 30-45％的相对错误拒绝率的提高。

Aug, 2018

通过自监督预训练实现噪声鲁棒的关键词检测

使用自我监督学习（SSL）预训练算法 Data2Vec 可以提高关键词识别（KWS）模型在嘈杂环境下的鲁棒性。

Mar, 2024

通过大规模训练实现领域不变语音识别

本研究旨在探讨利用不同应用范畴的大规模培训数据，构建单一领域不变模型的想法，以达到普适性应用并允许快速自适应，并通过实验证明培训模型的可行性和适应性。

Aug, 2018