Dec, 2023

超越相关性:大型语言模型是否学习到空间的因果表征?

TL;DR通过表示相似性分析和线性和非线性探测,我们发现了DeBERTa和GPT-Neo中潜在的空间表示,并通过因果干预实验证明了空间表示对模型的下一个词预测性能和依赖地理空间信息的下游任务的影响,这些实验证明了大型语言模型在解决地理空间相关任务时学习和使用内部空间模型。