BriefGPT.xyz
大模型
Ask
alpha
关键词
vrd-qa
搜索结果 - 1
IJCAI
PDF-MVQA:基于 PDF 的视觉问答多模信息检索数据集
针对长篇研究期刊文章等富有文本内容的视觉丰富文档,我们提出了 PDF-MVQA,旨在解决现有研究主要关注稀缺文本的现实世界文档的问题,而在理解多个页面之间的层次语义关系以定位多模态组件方面仍面临挑战。我们的贡献包括介绍了一个全面的 PDF
→
PDF
2 months ago
Prev
Next