BriefGPT.xyz
Ask
alpha
关键词
st-vqa dataset
搜索结果 - 1
ICCV
场景文本视觉问答
本文介绍了一个新数据集,即 ST-VQA,旨在强调利用图像中文本信息的重要性。我们使用这个数据集定义了一系列难度不断增加的任务,需要利用图像中提供的上下文阅读场景文本以进行推理和生成适当的答案。我们提出了一个新的评估指标来考虑推理错误以及文
→
PDF
5 years ago
Prev
Next