BriefGPT.xyz
Ask
alpha
关键词
modular vision-language models
搜索结果 - 1
高效多语言视觉 - LLMs 引导程序的启动
通过利用机器翻译产生多语言数据来实现对预训练的多语言 LLM 的图像编码器的重新对准,从而在消费者硬件上使用少量训练数据来获得第一款多语言 Vision-LLM,与从头开始训练的大规模 Vision-LLM 相比表现出色。
PDF
a year ago
Prev
Next