BriefGPT.xyz
大模型
Ask
alpha
关键词
practical code synthesis scenarios
搜索结果 - 1
NaturalCodeBench: 检视 HumanEval 和自然用户提示对编码性能不匹配的问题
大型语言模型在生产性活动的代码生成方面表现出强大的能力。然而,当前的代码合成基准主要面向算法和数据科学的入门任务,在真实世界的编码中对具有挑战性的要求不够满足。为了填补这一差距,我们提出了 NaturalCodeBench(NCB)作为一个
→
PDF
2 months ago
Prev
Next