Jul, 2024

大语言猴子:通过重复采样扩大推理计算能力

TL;DR本研究解决了推理计算中仅使用一次尝试的问题,探索了通过增加生成样本数量来改善模型表现的潜力。研究发现,样本数量的增加显著提升了解决问题的覆盖率,尤其在编码和形式证明等自动验证领域表现尤为突出,推动了深度学习模型的效率和成本效益。尤其是,DeepSeek-V2-Coder-Instruct在采样次数从一个增加到250时,解决问题的比例从15.9%跃升至56%。