Apr, 2019

使用百万小时的语音构建声学模型的经验教训

TL;DR本报告探讨了利用未标记语音数据进行声学模型构建的方法 —— 采用学生 / 教师训练和定期交替的有标记和未标记数据学习,并在分布式训练中利用 BMUF 和梯度阈值压缩 SGD,在较小的超参数调整范围内获得了 10 至 20%的识别率提高。