BriefGPT.xyz
Ask
alpha
关键词
multi-word answer
搜索结果 - 1
CVPR
超越 VQA: 生成多词答案和解释来回答视觉问题
本文介绍了一种新的任务 ——ViQAR(视觉问题回答和推理),并提出了一种完全生成式的解决方案,它能够为视觉查询生成完整的答案和推理,我们通过定性和定量评估以及人类图灵测试表明,我们的模型能够生成强有力的答案和推理。
PDF
4 years ago
Prev
Next