BriefGPT.xyz
Ask
alpha
关键词
safety of language models
搜索结果 - 1
自动检测大型语言模型中的不充分训练标记
我们通过分析 Tokenizer、基于模型权重的指标和启发式技术的结合,开发了一种有效的方法,用于自动检测在分词器词汇表中存在但在模型训练中很少或完全不存在的问题标记,我们的发现证明了这些标记在各种模型中的普遍存在性,并为改善语言模型的效率
→
PDF
2 months ago
Prev
Next