Aug, 2024

在视觉大模型中,增大编码器是否总是更好?

TL;DR本研究针对视觉语言模型(VLM)在扩大规模时的性能表现进行探讨。论文指出,仅仅增大编码器的规模并不一定能提升VLM的性能,同时分析了大型语言模型(LLM)的参数规模和数据质量对预训练结果的影响。这些发现对理解VLMs与LLMs之间的规模法则差异具有重要意义。