ACLMay, 2023

大小不一定胜:语言模型无法识别 Python 中的标识符交换

TL;DR本文表明大型语言模型在代码生成任务中表现出色,但在变量重命名等语言语义方面不及人类程序员,且存在反比例缩放现象。作者发现,尽管这些模型具有惊人的典型案例表现,它们仍然缺乏对所操作内容的深刻抽象理解,从而不适用于与其训练数据有明显偏差的任务,仅靠扩大规模是不够的。