May, 2025
感知、推理、思考与规划:大型多模态推理模型的综述
Perception, Reason, Think, and Plan: A Survey on Large Multimodal
Reasoning Models
TL;DR本研究针对大型多模态推理模型(LMRMs)中的推理能力进行了深入探讨,尤其是在开放、不确定及多模态环境中所面临的挑战。通过系统性回顾现有文献,本论文提出了一种结构化的发展路线图,着重介绍了任务特定模块到统一语言中心框架的演变,最终展望了原生大型多模态推理模型(N-LMRMs)在复杂真实环境中的适应性和规划能力。