BriefGPT.xyz
Apr, 2018
语音命令:有限词汇语音识别数据集
Speech Commands: A Dataset for Limited-Vocabulary Speech Recognition
HTML
PDF
Pete Warden
TL;DR
本文描述了一份音频数据集,可以用于训练和评估关键词检测系统,并介绍了为什么该任务是一个有趣的挑战,以及为什么需要不同于用于自动语音识别的常规数据集的专门数据集。本文还提出了一种方法来实现可重复和可比较的准确性指标,并描述了数据的收集和验证方式、数据的属性以及以前的版本。最后,报告了在该数据集上训练的模型的基线结果。
Abstract
Describes an
audio dataset
of spoken words designed to help train and evaluate
keyword spotting systems
. Discusses why this task is an interesting challenge, and why it requires a specialized dataset that is diff
→