Mar, 2025
动态复杂度感知代码基准:评估大语言模型在代码生成中的性能
DynaCode: A Dynamic Complexity-Aware Code Benchmark for Evaluating Large
Language Models in Code Generation
TL;DR本研究针对现有静态代码基准的局限性,提出了DynaCode,一个动态的复杂度感知基准,用于评估大型语言模型在代码生成任务中的表现。DynaCode能够生成多达1.89亿个独特的嵌套代码问题,并系统性地评估模型在不同复杂度下的性能变化,结果显示相比于静态基准,性能平均下降幅度达到16.8%至45.7%。