Mar, 2025

Astrea:基于 MOE 的逐步对齐视觉理解模型

TL;DR本研究解决了多模态理解中任务异质性和专家负载不平衡的问题。提出的Astrea模型通过逐步预对齐的创新方法,结合了多个专门模型,提高了视觉与语言信息的整合能力。实验证明,该模型在多个基准任务中的表现相比现有先进模型提高了平均4.7%,为通用多模态代理的开发奠定了新的方法基础。