Apr, 2025
推理模型在无需思考的情况下也能有效
Reasoning Models Can Be Effective Without Thinking
TL;DR本研究探讨了是否需要显式的思考过程来提高大型语言模型(LLMs)的推理能力。通过使用深度学习模型DeepSeek-R1-Distill-Qwen,研究表明跳过思考过程的简单提示方式(称为NoThinking)在多个推理任务中表现优异,特别是在低预算条件下。研究结果呼吁重新考虑冗长思考过程的必要性,并为低预算或低延迟环境下的推理性能提供了有竞争力的参考。