BriefGPT.xyz
Oct, 2023
用于代码的大型语言模型的程序测试能力
The Program Testing Ability of Large Language Models for Code
HTML
PDF
Weimin Xiong, Yiwen Guo, Hao Chen
TL;DR
利用对最近的大型语言模型进行了代码测试的详尽分析,本研究展示了这些模型的一系列有趣性质,并展示了如何改进大型语言模型的程序测试能力,通过利用生成的测试用例来提高合成程序的质量,相较于GPT-3.5-turbo和最新的最先进技术,我们的方法在HumanEval+上的代码通过率分别提高了11.77%和4.22%。
Abstract
Recent development of
large language models
(LLMs) for code like CodeX and CodeT5+ demonstrates tremendous promise in achieving
code intelligence
. Their ability of synthesizing code that completes a program for p
→