Oct, 2022

调查域选择对孟加拉孟加拉语自动语音识别表现的影响:以案例研究为例

TL;DR本研究中,我们通过评估一个最先进的孟加拉语自动语音识别模型,证明了领域选择的重要性,该模型在新的多领域孟加拉语 ASR 评估基准 - BanSpeech 上进行评估,其中包含来自 19 个不同领域的 9802 个话语。该 ASR 模型已经在 SUBAK.KO 上进行了训练,使用了深度卷积神经网络,层规范化技术和连接时序分类丢失准则,评估结果表明该 ASR 模型很难识别源于大部分自发性言论的领域的语音,并且包含的生词数量很多,在阅读语音领域表现更好并且包含更少的生词。