Feb, 2025
基于粒子蒙特卡罗方法的LLMs推理时缩放的概率推理方法
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs
using Particle-Based Monte Carlo Methods
TL;DR本研究解决了大语言模型推理时间计算效率的不足,提出了一种将推理时缩放视为概率推理任务的新方法。通过适应粒子蒙特卡罗方法,本方法在各种数学推理任务上展示了比现有确定性搜索方法更好的缩放率,该方法的应用可能提升LLMs的性能和鲁棒性。