Jul, 2024

LLaVA-NeXT-Interleave:处理大型多模态模型中的多图像、视频和3D问题

TL;DRLLaVA-NeXT-Interleave同时处理LMMs中的多图像、视频、三维和单图像情景,具有出色的多图像、视频和三维基准结果,并展示了几种新兴能力。