Mar, 2024

Cobra: 扩展 Mamba 至多模态大型语言模型以实现高效推理

TL;DR通过将高效的 Mamba 语言模型引入视觉模态,Cobra 实现了线性计算复杂度的多模态大型语言模型,其在现有的计算效率高的方法上表现出极具竞争力的性能,并且具有更快的速度;同时,Cobra 在克服视觉错觉和空间关系判断方面表现出色,甚至与 LLaVA 在参数数量只有 43% 时表现相当;我们将开源 Cobra 的所有代码,希望该方法能促进 MLLM 的复杂性问题的未来研究。