BriefGPT.xyz
Ask
alpha
关键词
automated programming
搜索结果 - 2
CodeHalu: 基于执行验证的 LLMs 驱动的代码幻觉
大型语言模型在代码生成领域取得了显著的进展,为自动化编程和开发人员提供了前所未有的支持。然而,大型语言模型有时生成的代码虽然看似合理,但无法满足预期要求或执行不正确。本研究提出了基于执行验证的代码幻觉定义方法,并首次引入了代码幻觉的概念,将
→
PDF
2 months ago
大型语言模型的面向对象编程评估基准
推动自动化编程需要强大和全面的代码生成基准,然而当前的评估框架在功能编程 (FP) 方面相对而言忽视了面向对象编程 (OOP),本研究引入了一个面向对象编程的开创性基准,包含了 431 个涵盖关键的 OOP 概念和特性的 Python 程序
→
PDF
6 months ago
Prev
Next