BriefGPT.xyz
大模型
Ask
alpha
关键词
execution-based benchmarks
搜索结果 - 1
CodeBenchGen: 创建可扩展的基于执行的代码生成基准
用 CodeBenchGen 框架创建可扩展的基于执行的基准测试,利用大型语言模型将任意代码转换为评估示例,并通过 Exec-CSN 数据集展示了人类和模型在代码生成系统上的性能分析。
PDF
3 months ago
Prev
Next