BriefGPT.xyz
Ask
alpha
关键词
multimodal semantic graph
搜索结果 - 1
VQA-GNN:用多模态语义图推理进行视觉问答
本文介绍了 Visual Question Answering——Graph Neural Network 模型,用于解决视觉理解中的概念层次推理问题,与现有模型相比,该模型将图像级别信息和概念知识进行了统一,并在 VCR 任务中取得了优于
→
PDF
2 years ago
Prev
Next