Aug, 2024

DOCE:基于执行的代码生成中的最佳执行点

TL;DR本研究解决了现有LLM代码生成方法缺乏综合比较框架的问题,提出了一套包含候选生成、n-best 重排名、最小贝叶斯风险解码和自我调试的综合框架。研究结果强调了基于执行的方法的重要性,并展示了通过单元测试过滤的简单有效策略对提升代码生成性能的影响。