BriefGPT.xyz
大模型
Ask
alpha
关键词
codeeditorbench
搜索结果 - 1
CodeEditorBench: 大型语言模型的代码编辑能力评估
通过 CodeEditorBench,我们为 LLMs 的代码编辑能力提供了一个可靠的评估平台,其中 19 个 LLMs 的评估结果表明闭源模型(特别是 Gemini-Ultra 和 GPT-4)在 CodeEditorBench 中优于开
→
PDF
3 months ago
Prev
Next