Oct, 2023

GPT-4 能否复制实证软件工程研究?

TL;DR本研究旨在考察大型语言模型(如 GPT-4)在新数据上执行经验软件工程研究的复制能力,发现 GPT-4 能够提供正确的假设,但难以生成反映软件工程数据的常规知识的假设,同时在生成的代码中存在实现层面错误,显示出对软件工程知识的欠缺。这些发现对于利用 LLMs 进行软件工程研究以及软件团队中的数据科学家具有重要意义。