BriefGPT.xyz
大模型
Ask
alpha
关键词
document ai models
搜索结果 - 2
EMNLP
一个多模态多语言文件图像分类基准
文档图像分类是一项与纯文本文档分类不同的任务,它通过理解表单、电子邮件和其他文档的内容和结构来对文档进行分类。本研究介绍了两个新的多语言数据集 WIKI-DOC 和 MULTIEURLEX-DOC,克服了现有数据集的限制。此外,本研究对以前
→
PDF
8 months ago
EMNLP
DocTrack: 一个与人眼运动真正对齐的视觉丰富的文档数据集,用于机器阅读
使用者眼动追踪技术对齐的 VRD 数据集,研究人类阅读顺序对文档理解任务的影响,结果显示虽然文档 AI 模型取得了显著进展,但在与人类相比准确、连续和灵活地阅读 VRD 方面仍有很长的路要走,对未来的文档 AI 模型研究和开发具有潜在的影响
→
PDF
8 months ago
Prev
Next