Feb, 2024

基于大型语言模型和蒙特卡洛树搜索的多步骤合成验证

TL;DR使用蒙特卡洛树搜索指导大型语言模型生成在 Dafny、Lean 和 Coq 中验证的程序的方法,该方法称为 VMCTS,在组合 LLM 先验知识和验证器反馈的情况下,提高了开源模型的综合能力,在五个验证编程问题中,VMCTS 以 6 分钟内解决了四个问题,与具有插件和多次尝试的 ChatGPT4 在这些问题上具有竞争力。