BriefGPT.xyz
Ask
alpha
关键词
glitch tokens
搜索结果 - 2
自动检测大型语言模型中的不充分训练标记
我们通过分析 Tokenizer、基于模型权重的指标和启发式技术的结合,开发了一种有效的方法,用于自动检测在分词器词汇表中存在但在模型训练中很少或完全不存在的问题标记,我们的发现证明了这些标记在各种模型中的普遍存在性,并为改善语言模型的效率
→
PDF
2 months ago
大型语言模型中的故障令牌:分类体系和有效检测
使用三种不同的分词工具,通过实验对七种顶级常用大型语言模型进行研究,发现了异常标志词 “glitch tokens”,并在嵌入空间中发现了它们的聚类规律,通过提出的基于聚类的新技术 GlitchHunter 显著优于三种基准方法,为减少大型
→
PDF
3 months ago
Prev
Next