BriefGPT.xyz
大模型
Ask
alpha
关键词
image-text pairing
搜索结果 - 2
SciMMIR:科学多模态信息检索的基准评测
通过高级表示学习和跨模态对齐研究,在图像 - 文本匹配方面取得了显著进展。为了弥补科学领域中目前评估图像 - 文本匹配性能的不足,我们开发了一种专门的科学多模态信息检索(SciMMIR)基准,利用开放获取的论文集提取与科学领域相关的数据,包
→
PDF
5 months ago
MiniGPT-4: 借助先进的大型语言模型增强视觉 - 语言理解
本文介绍了 MiniGPT-4 模型,该模型利用像 GPT-4 这样的先进的大型语言模型(LLM)与视觉编码器对齐,可以生成详细的图像描述和从手写草图中创建网站等多重能力,采用对齐的图文数据集训练可以提高生成的可靠性和整体可用性。
PDF
a year ago
Prev
Next