BriefGPT.xyz
大模型
Ask
alpha
关键词
region representation
搜索结果 - 2
通过提示实现任意分词
我们提出了一个统一的、可提示的模型,能够同时分割、识别和描述任何物体。与 SAM 不同的是,我们通过视觉提示在野外构建多用途区域表示。我们使用来自具有 50 亿参数的经过预训练的 CLIP 模型的大规模分割掩码,例如 SA-1B 掩码,和语
→
PDF
7 months ago
Ferret: 任意粒度引用和定位任何内容
我们介绍了 Ferret,这是一个新的多模态大型语言模型(MLLM),能够理解图像中任何形状或粒度的空间引用,并准确地确定开放词汇的描述。
PDF
9 months ago
Prev
Next