Sep, 2024

RethinkMCTS:在蒙特卡罗树搜索中修正错误思维以进行代码生成

TL;DR本研究解决了现有代码生成中蒙特卡罗树搜索算法低搜索质量的问题,主要由于搜索空间设计不当和反馈整合不足。我们提出了一种新方法RethinkMCTS,通过思维级搜索与代码执行反馈相结合,显著提升了搜索的效率和质量,实验证明算法在代码生成性能上优于以往基线,特别在HumanEval数据集上实现了更高的通过率。