Jun, 2024

诺米嵌入视觉:扩展潜在空间

TL;DR描述了训练 nomic-embed-vision 的技术报告,它是一种高性能、开放代码、开放权重的图像嵌入模型,与 nomic-embed-text 共享相同的潜在空间。nomic-embed-vision 和 nomic-embed-text 共同构成了首个实现在视觉、语言和多模态任务中获得高性能的统一潜在空间。