Jul, 2024

ML-Mamba:利用Mamba-2的高效多模态大型语言模型

TL;DR本研究针对传统Transformer架构计算复杂性高的问题,提出了一种高效的多模态语言模型ML-Mamba,该模型基于最新的Mamba-2,具有快速处理长序列的能力。实验结果表明,ML-Mamba在多模态任务中具有竞争力的性能,其推理速度更快,且在减少参数数量的同时,表现出色。