BriefGPT.xyz
大模型
Ask
alpha
关键词
outside-knowledge visual question answering
搜索结果 - 3
EMNLP
面向实体的密集语段检索用于外部知识视觉问答
本论文提出了一种 Entity-Focused Retrieval (EnFoRe) 模型,通过识别问题相关实体来检索更具特定性的知识。实验证明,我们的 EnFoRe 模型可以在当前最大的 OK-VQA 数据集上实现卓越的检索性能,并与最先
→
PDF
2 years ago
EMNLP
带有外部知识的检索增强型视觉问答
我们提出了一种联合训练方案,该方案包括可微分的 DPR 集成答案生成,以便系统可以以端到端的方式进行训练。 我们的实验表明,我们的方案优于最近的具有强大 DPR 进行检索的 OK-VQA 系统。 我们还引入了新的诊断指标来分析检索和生成之间
→
PDF
2 years ago
千言万语胜于一幅图:自然语言为中心的外部知识视觉问答
该论文提出了一种利用海量知识库和预训练语言模型的模型,通过将图像转换为纯文本,以进行知识检索和自然语言生成问答,其中使用的框架为 TRiG 框架,并取得了比所有最先进的监督方法多至少 11.1%的绝对优势。
PDF
2 years ago
Prev
Next