Apr, 2024

GPT-4V 的进展:通过开源套件缩小与商业多模型的差距

TL;DRInternVL 1.5 是一种开源的多模态大型语言模型,通过引入强大的视觉编码器、动态高分辨率和高质量双语数据集三个简单改进,提升了多模态理解的能力,在 OCR 和中文相关任务中达到与传统型和专有模型相竞争的性能。