BriefGPT.xyz
大模型
Ask
alpha
关键词
layoutlmv3
搜索结果 - 3
使用多模态 Transformers 的科学图表中的文本角色分类
文本角色分类涉及对科学图表中的文本元素进行语义角色分类。我们提出在图表数据集上对两个预训练的多模态文档布局分析模型 LayoutLMv3 和 UDOP 进行微调,并利用文本、图像和布局这三种模态作为输入。我们进一步研究了数据增强和平衡方法是
→
PDF
5 months ago
使用 LayoutLMv3 进行语义表格检测
本文介绍了一种利用 LayoutLMv3 模型对 IIIT-AR-13K 数据集中的财务文件进行语义表格检测的应用,发现模型表格检测能力并没有得到提升,可能是模型权重不适合所需,或需要更多的优化时间,又或者语义信息并不会提高模型的表格检测准
→
PDF
2 years ago
LayoutLMv3: 统一文本和图片遮盖的文档 AI 预训练
本文提出的 LayoutLMv3 是一种用于文档人工智能的多模态 Transformer 的预训练方法,用于统一文本和图像遮蔽,并通过预测文本单词的对应图像块是否被遮蔽的方式进行跨模态对齐。实验结果表明,LayoutLMv3 不仅在文本中心
→
PDF
2 years ago
Prev
Next