Jul, 2023

高效多语言视觉 - LLMs 引导程序的启动

TL;DR通过利用机器翻译产生多语言数据来实现对预训练的多语言 LLM 的图像编码器的重新对准,从而在消费者硬件上使用少量训练数据来获得第一款多语言 Vision-LLM,与从头开始训练的大规模 Vision-LLM 相比表现出色。