May, 2025

大语言模型训练的神经热力学定律

TL;DR本研究针对当前大语言模型训练的理论空白,提出了神经热力学定律(NTL)这一新框架。通过对热力学量及经典热力学原理的分析,研究为学习率调度的设计提供了直观指导,具有重要的理论与实践意义。