Jan, 2025

在线提示与求解器选择用于程序合成

TL;DR本研究旨在解决大型语言模型在程序合成中的表现不均衡问题,包括任务、模型及提示风格的不匹配。通过将问题框架化为在线学习问题,提出了一个新的多臂老虎机算法,以优化符号求解器或语言模型与提示的选择。研究表明,所提出的方法CYANEA能比最佳单一求解器多解决37.2%的查询,并且与虚拟最佳求解器的结果相差仅4%。