BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal world knowledge
搜索结果 - 1
REVEAL:基于检索增强的多源多模态知识记忆的视觉语言预训练
本文提出了一种端到端检索增强的视觉语言模型(REVEAL),它可以将世界知识编码到大规模存储器中,并从中检索以回答知识密集型查询。
PDF
2 years ago
Prev
Next