Dec, 2023

Gemini: 一系列高能力的多模态模型

TL;DR介绍了一种新的多模态模型 Gemini 系列,具备对图像、音频、视频和文本的出色理解能力。Gemini 系列包括 Ultra、Pro 和 Nano 三种规模,适用于从复杂推理任务到内存受限的设备使用场景。在广泛的基准测试中,我们最强大的 Gemini Ultra 模型在 32 个基准测试中的 30 个中领先于现有技术水平,特别是在经典考试基准测试 MMLU 中,Gemini 是首个达到人类专家水平的模型,并在我们检验的 20 个多模态基准测试中改进了现有技术水平。我们相信 Gemini 模型在跨模态推理和语言理解方面的新能力将被广泛应用,并讨论了我们在向用户负责地部署这些模型方面的方法。