May, 2025

感知、推理、思考与规划:大型多模态推理模型的综述

TL;DR本研究针对大型多模态推理模型(LMRMs)中的推理能力进行了深入探讨,尤其是在开放、不确定及多模态环境中所面临的挑战。通过系统性回顾现有文献,本论文提出了一种结构化的发展路线图,着重介绍了任务特定模块到统一语言中心框架的演变,最终展望了原生大型多模态推理模型(N-LMRMs)在复杂真实环境中的适应性和规划能力。