May, 2023

一种生成预训练变压器的相干波动态和语言生成

TL;DR研究了波动力学在小型 GPT 中的表现,发现波动动力学提供了一种内在的振荡模式,同时具有上下文感知的可塑性和表达能力,在分析波动模式、相干性和聚类的基础上,为人们提供了系统地识别和解释隐藏状态通道功能的方法。此外,研究了在文本序列生成中不同阶段的拼写错误的泊松统计,探讨了正确和错误拼写的比较,并得出了正确拼写从泊松分布向亚泊松分布转变的规律,为深入理解大型语言模型的能力和开发更专业的模型开辟了新机遇。