BriefGPT.xyz
Ask
alpha
关键词
multimodal document layout analysis
搜索结果 - 1
使用多模态 Transformers 的科学图表中的文本角色分类
文本角色分类涉及对科学图表中的文本元素进行语义角色分类。我们提出在图表数据集上对两个预训练的多模态文档布局分析模型 LayoutLMv3 和 UDOP 进行微调,并利用文本、图像和布局这三种模态作为输入。我们进一步研究了数据增强和平衡方法是
→
PDF
5 months ago
Prev
Next