BriefGPT.xyz
大模型
Ask
alpha
关键词
document understanding tasks
搜索结果 - 2
基于图注意力网络的多模态预训练在文档理解中的应用
本文提出了一种基于多模态图注意力机制的图文结合的自动文档分析模型 (GraphDoc),该模型利用文本、布局和图像信息进行多模态预训练,并通过门控融合层对每个节点进行多模态特征融合,通过图注意层建模每个节点之间的上下文关系,学习了仅使用 3
→
PDF
2 years ago
ACL
MarkupLM: 面向富媒体文档理解的文本和标记语言预训练
本研究论文探讨了一种名为 MarkupLM 的预训练模型,它能够对 HTML/XML 等标记语言的文档进行理解和分析,相比现有的基于布局的预训练方法,在布局可交互和动态渲染的数字文档中有着更好的性能表现。实验证明,该预训练模型在多个文档理解
→
PDF
3 years ago
Prev
Next