Aug, 2024

在测试时间计算中的最佳扩展比扩大模型参数更有效

TL;DR本研究解决了在大型语言模型(LLM)测试时间计算的规模问题,探讨如何利用固定的计算资源显著提高模型在复杂提示上的表现。论文提出了一种“计算最优”的扩展策略,能够根据提示的难度动态分配计算资源,经过验证,此策略比现有基准提高了超过4倍的计算效率,并在特定情况下超越了14倍大模型的性能。