BriefGPT.xyz
Ask
alpha
关键词
token distributions
搜索结果 - 1
大数定律的奴隶:生成式语言模型中困惑度的渐近等分性质
我们提出了一个新的渐进均分特性来解析语言模型生成的大段文本的困惑度,并对该特性提出理论证明。困惑度,作为一个逆似然函数,被广泛用作训练语言模型的性能度量。我们的主要结果表明,由语言模型生成的任何大段文本的对数困惑度必须渐进地收敛到其令牌分布
→
PDF
a month ago
Prev
Next