Dec, 2013

使用幂律秩合奏实现语言建模

TL;DR该论文提出了一种灵活的 n-gram 语言建模框架 ——Power Low Rank Ensembles,使用低秩矩阵和张量的集合来获得单词上下文中平滑的概率估计,该方法可以理解为 n-gram 建模到非整数 n 的推广,可用于诸如绝对折扣和 Kneser-Ney 平滑等标准技术。PLRE 训练有效,并且在大型语料库上的困惑度和下游机器翻译任务中的 BLEU 分数方面优于最先进的修改的 Kneser Ney 基线方法。