Feb, 2024

基于 Transformer 的因果语言模型进行聚类

TL;DR通过对合成数据集的分析,我们发现大规模语言模型通过将数据在其隐藏空间内进行聚类学习特定任务的信息,并且这个聚类过程在学习过程中动态演化,从而帮助模型处理未知的实例。