Aug, 2024

大型语言模型中的下一标记预测法则

TL;DR本研究解决了大型语言模型(LLMs)在理解内部输入数据处理过程中的黑箱问题。我们提出了一种定量法则,揭示每一层在提高下一标记预测的准确性方面均作出相等贡献。这一发现对LLM的设计、训练和应用具有重要影响,提供了新的指导思路。