Jun, 2024

ColPali:视觉语言模型高效文档检索

TL;DR通过引入 Visual Document Retrieval Benchmark ViDoRe,本研究介绍了一种基于图像的检索模型 ColPali,该模型利用近期的视觉语言模型理解文档并生成高质量的语境化嵌入,通过后期交互匹配机制,ColPali 显著提高了现代文档检索的性能并且训练速度更快。