May, 2024

自动检测大型语言模型中的不充分训练标记

TL;DR我们通过分析 Tokenizer、基于模型权重的指标和启发式技术的结合,开发了一种有效的方法,用于自动检测在分词器词汇表中存在但在模型训练中很少或完全不存在的问题标记,我们的发现证明了这些标记在各种模型中的普遍存在性,并为改善语言模型的效率和安全性提供了启示。