May, 2025

可扩展的思维链通过弹性推理

TL;DR本研究解决了大型推理模型在复杂任务中输出长度不受控的问题,影响其在实际应用中的部署。提出的弹性推理框架将推理过程明确分为思考和解决两阶段,并独立分配预算,显著提高了在资源紧张情况下的可靠性。实验证明,弹性推理在严格预算约束下表现出色,同时训练成本显著低于基线方法。