BriefGPT.xyz
大模型
Ask
alpha
关键词
devleval
搜索结果 - 2
ACL
DevEval:与现实世界源代码仓库对齐的手动注释代码生成基准
通过新的基准测试 DevEval,我们评估了 8 种流行的大型语言模型在真实代码库中的编码能力,并发现这些模型的编码能力在真实世界的代码库中存在缺陷。
PDF
a month ago
DevEval: 评估实际软件项目中的代码生成
通过提出一个与开发者在实践项目中的经验相一致的新基准 DevEval,我们评估了五个热门的大型语言模型在代码生成方面的实际能力,揭示了它们的实际表现,并讨论了在实践项目中代码生成的挑战和未来发展方向。
PDF
6 months ago
Prev
Next