Oct, 2017

用于混合代码语言模型的句法和语义特征

TL;DR本研究针对语音识别中的 Code-Switching 现象,提出将语法和语义因素融入语言模型的方法,并对不同因素的效果进行了实验验证,结果显示采用 Brown 单词聚类、词性标注和开放类词语等因素可以有效减少语言模型复杂度,该最佳模型可以将错词率降低 3.4% 至 10.8%。