BriefGPT.xyz
Ask
alpha
关键词
function calls
搜索结果 - 1
MM
BigCodeBench:多样化函数调用和复杂指令的代码生成基准
基于大型语言模型 (LLMs) 的自动化软件工程在最近的进展中得到了极大的增强。尽管当前的基准测试表明 LLMs 可以完成各种软件工程任务,如人类开发人员一样,但它们的大多数评估仅限于简短的、自包含的算法任务。解决具有挑战性和实际意义的编程
→
PDF
14 days ago
Prev
Next