Feb, 2024

Tokenization 计数: Tokenization 对前沿 LLM 模型中的算术的影响

TL;DR数字分词选择对算术任务模型效果产生显著影响;使用从右到左的分词方式能够明显提升性能,并显示出模型计算具有系统性;针对左到右分词方向模型的错误模式进行了深入分析,发现模型能够轻松转换分词方式