Oct, 2022

AmberNet: 一种紧凑的端到端口语识别模型

TL;DRAmberNet是一种用于口语识别的紧凑端到端神经网络,由一维深度可分离卷积和全局上下文的Squeeze-and-Excitation层、统计汇聚和线性层组成,大小是现有技术(SOTA)模型的1/10,准确率达到FLEURS基准的SOTA,可用于新语言和音频条件的简单微调。它在输入长度敏感性方面的表现良好。