Jul, 2023

基于 Transformer 语言模型和 n-gram 困惑度的文本向量化

TL;DR该研究提出了一种基于 n-gram 困惑度计算的向量值算法,以替代仅有一个困惑度值的标量困惑度,该算法考虑了概率、困惑度、文本、标记等方面,并将这些值合并为表示输入的单个向量。