Jul, 2020

多语言 CapsNet 模型的细粒度语言识别

TL;DR本文提出了一种实时语音检测方法,采用 Capsule Networks 架构,能以高达 91.8%的准确率检测出 5 秒音频片段中的口语语言,数据要求和预处理工作较少。