Jul, 2018

面向会话语音的标点符号预测模型

TL;DR本文通过训练基于深度神经网络技术的双向长短期记忆网络(BLSTM)和卷积神经网络(CNN)的序列标注模型,来解决语音识别系统中无法正常预测标点符号的问题,并且通过在 Fisher 语料库上的实验证明,基于卷积神经网络预测标点符号的方法更加精确。同时,本文结果表明,将 Fisher 语料库转化为时间对齐的文本以及采用预训练嵌入模型可以提高标点预测的准确性。