BriefGPT.xyz
Ask
alpha
关键词
mostly hard python problems
搜索结果 - 1
MHPP: 探索语言模型在基本代码生成之外的能力和局限性
最近大型语言模型(LLMs)在代码生成方面有了显著进展,但现有的基准测试无法全面评估 LLMs 在函数级代码生成能力方面的充分性。通过分析两个常见的基准测试(HumanEval 和 MBPP),我们的研究发现由于质量、难度和细度的限制,这些
→
PDF
2 months ago
Prev
Next