Jun, 2022

TALCS:一份开源的汉英混杂语料库及其语音识别基准

TL;DR本文介绍了一种新的普通话 - 英语混用语音识别语料库 (TALCS corpus),适用于训练和评估混合语音识别系统。使用 TALCS 语料库,作者在两个流行的语音识别工具包(ESPnet 和 Wenet)上进行实验以构建基线系统,证明了录音和转录的质量很有前途且基线系统可行。