May, 2024

大型语言模型输出分布的相变

TL;DR通过统计距离量化输出生成中的分布变化,本研究利用物理学界提出的自动检测相变的统计方法,成功地将其应用于大型语言模型中,以发现新的行为状态和未探索的转变。