Feb, 2024

受限预算下的工具学习与规划

TL;DR本文提出了一种应对预算约束的工具学习的新方法,通过在利用工具之前创建一个在预算约束下可行的计划,给出了大规模语言模型中工具学习过程的全面概述,从更广泛的角度来分配预算。该方法主要涉及创建一个可行的计划和指定候选工具的最大使用次数,将过去的经验用于候选工具的有效性估计,并通过动态规划来制定计划。实验结果表明,我们的方法可以与各种工具学习方法相结合,在严格的预算约束下显著提高其效果。