Apr, 2025

ReasonIR:为推理任务训练检索器

TL;DR本研究针对现有检索器在推理任务中表现有限的问题,提出了第一个专门为通用推理任务训练的检索器ReasonIR-8B。通过合成数据生成管道,ReasonIR-8B在BRIGHT基准测试中实现了新的最先进成绩,提高了相对闭卷基线的MMLU和GPQA性能,展现了其在推理任务中的显著优势,并且其训练方法具有广泛的适用性。