May, 2023

训练于编程语言的语言模型中有意义迹象的证据

TL;DR本文研究使用程序语言这一中间测试平台,探究语言模型是否能够理解语义,并发现 Transform 模型可通过样例抽象出当前和未来程序状态,使用的探测器准确率与执行输入所生成的程序一致。文中还提出了一种语义干预的实验方法,并展示了模型能够生成更短、更正确的程序。