BriefGPT.xyz
大模型
Ask
alpha
关键词
vrd dataset
搜索结果 - 3
EMNLP
DocTrack: 一个与人眼运动真正对齐的视觉丰富的文档数据集,用于机器阅读
使用者眼动追踪技术对齐的 VRD 数据集,研究人类阅读顺序对文档理解任务的影响,结果显示虽然文档 AI 模型取得了显著进展,但在与人类相比准确、连续和灵活地阅读 VRD 方面仍有很长的路要走,对未来的文档 AI 模型研究和开发具有潜在的影响
→
PDF
8 months ago
NeSy4VRD: 用知识图谱进行视觉关系检测的神经符号化人工智能研究多方面资源
NeSy4VRD 是一个多面资源,以支持神经符号 AI (NeSy) 研究的发展为设计目的。其中包括 VRD 数据集的图像和经过大幅度修订、质量改进的 VRD 视觉关系标注。重要的是,NeSy4VRD 提供了一个与数据集领域相关的用于描述本
→
PDF
a year ago
深度监督的多模态注意力翻译嵌入在视觉关系检测中的应用
本论文提出了一种新的基于深度学习的架构 —— 多模态注意力翻译嵌入模型,该模型使用多模态关注机制驱动每个分支的视觉特征,并在常用的 VRD 数据集上的实验表明,该方法明显优于其他相关方法。
PDF
5 years ago
Prev
Next