Jan, 2025
URSA:理解和验证多模态数学中的思维链推理
URSA: Understanding and Verifying Chain-of-thought Reasoning in
Multimodal Mathematics
TL;DR本研究解决了多模态数学推理中高质量思维链(CoT)训练数据稀缺的问题,限制了现有模型的推理精度。通过提出结合CoT蒸馏、轨迹格式重写和格式统一的三模块综合策略,构建了一个高质量的CoT推理指令微调数据集MMathCoT-1M,并验证了训练后的URSA-7B模型在多个基准上的表现,推动了数学推理能力的提升。