Jan, 2024

Infini-gram:扩展至万亿标记的无界 n-gram 语言模型

TL;DRn-gram 语言模型在神经网络大型语言模型时代仍然具有重要意义,本研究展示了其在文本分析和改进神经网络大型语言模型中的价值,并从两个方面对 n-gram 模型进行现代化改进:在与神经网络大型语言模型相同的数据规模下进行训练,建立最大的 n-gram 模型,以及允许 n 的大小任意增加,并引入具备毫秒级延迟的 suffix 数组驱动引擎 infini-gram 来计算无限阶的 n-gram 概率。