Feb, 2024

ChatGPT 是否能够支持开发者?对于代码生成的大型语言模型的实证评估

TL;DR大型语言模型在代码生成方面展示了显著的熟练度,并通过许多先前的研究在各种开发场景中显示了它们的有希望的能力。然而,这些研究主要在研究环境中进行评估,这在了解 LLMs 在实际开发中如何有效地支持开发人员方面存在重大差距。通过对来自开发人员与 ChatGPT 的对话的数据集 DevGPT 进行实证分析,我们的实证发现表明,目前使用 LLM 生成的代码的实践通常仅限于展示高级概念或在文档中提供示例,而不是用于生产就绪的代码。这些发现表明,在 LLMs 成为现代软件开发的重要组成部分之前,还需开展大量未来工作来改进 LLMs 在代码生成方面的能力。