Feb, 2024

EffiBench:自动生成代码效率测评

TL;DREffiBench 是一个包含 1000 个效率关键的编码问题的基准测试,用于评估由代码生成模型生成的代码的效率,结果表明 GPT-4 Turbo 生成的代码最有效,但仍比人工编写的规范解决方案效率低。