关键词language model perplexity
搜索结果 - 2
- 挖掘错误模板以进行语法错误修正
该研究提出基于网络爬虫自动挖掘错误模板的语法纠错技术,其中错误模板是一种用于识别文本错误的正则表达式,利用语言模型困惑度作为评价标准选择相应的修正行为。实验结果表明,结合错误模板的强 GEC 系统的性能可以有效提高,特别是在很少训练数据的情 - 阿拉伯语 - 英语代码切换语音识别的文本数据增强
本文基于随机词汇替换和等价约束,利用对齐翻译对生成随机合法的混合语言内容进行零样本学习,以解决跨语言语音识别中数据稀缺性、语法结构复杂性和领域匹配问题,实验结果显示,所提出的方法在两个生态有效的混合语言测试集上相对降低了 65.5% 的语言