BriefGPT.xyz
Ask
alpha
关键词
$n$-grams
搜索结果 - 3
使用 Rusty-DAWG 评估语言模型的 n-Gram 新颖性
研究了语言模型生成的文本与其训练语料库之间的新颖程度,并通过评估生成的 $n$-gram 的概率和 $n$- 新颖性来揭示影响生成新颖性的因素。发现对于较大的 $n$,语言模型生成的文本不如人为编写的文本新颖,但对于较小的 $n$,则更为新
→
PDF
18 days ago
信号在噪音中:使用字符感知语言模型探索随机字符序列中的编码含义
本文提出使用 $garble$,即由随机字符序列组成的 $n$-grams,作为语境来研究字词含义,同时探讨了 $garble$ 字向量、终极语言和伪词的嵌入,并通过 CharacterBERT 模型识别嵌入空间中将这些 $n$-grams
→
PDF
2 years ago
使用多词表达方式视觉化主题
提出了一种用于主题可视化的新方法,使用潜在变量模型自动提取大型文本语料库中的 term 分布,并利用与主题相关的重要短语来解释该分布。该方法使用基于任意长度表达式的语言模型,并提出了一种基于嵌套排列检验的新方法来查找重要短语。结果表明,该方
→
PDF
15 years ago
Prev
Next