MMNov, 2021

一种基于卷积神经网络的方法,用于识别孟加拉语口语中的数字

TL;DR该研究使用多年龄、性别和方言的孟加拉人的音频记录创建了大型的 “0-9” 孟加拉数字口语数据集并使用 Mel 频率倒谱系数和卷积神经网络来识别数字,该方法在整个数据集中达到了 97.1%的准确率并使用 10 倍交叉验证进行了评估,得出 96.7%的准确性。