Oct, 2024

语言模型如何以十进制数字表示法编码数字

TL;DR本研究解决了大型语言模型在处理数字问题时常出现错误的现象。我们通过实验表明,语言模型内部以十进制的每个数字的循环表示法来表示数字,而非简单的数值表示。这一发现有助于理解模型在数字推理任务中出现的错误模式,并为未来研究语言模型中的数字机制提供基础。