May, 2025
ZeroSearch:在不进行搜索的情况下激励大语言模型的搜索能力
ZeroSearch: Incentivize the Search Capability of LLMs without Searching
TL;DR本研究解决了大语言模型(LLMs)在信息检索中的搜索能力不足问题。提出了ZeroSearch,一个通过强化学习框架来激励LLMs搜索能力的新方法,该方法不依赖真实搜索引擎,使用轻量级的监督微调并逐步提高检索难度。研究表明,ZeroSearch能有效提升LLMs的检索能力,且在参数规模较大的模型上性能优越。