BriefGPT.xyz
Ask
alpha
关键词
document layout
搜索结果 - 4
SwinDocSegmenter:一种端到端的统一领域自适应变压器用于文档实例分割
本文提供了一个用于端到端的文档图像中的复杂布局的实例级分割的统一 Transformer 编码器 - 解码器架构,并且在对 PubLayNet,PRIMA,Historical Japanese(HJ)和 TableBank 等竞争基准的广
→
PDF
a year ago
知其所在,知其所含:面向文档理解的统一词块预训练
本文提出了一种名为 UTel 的基于文本和布局的统一预训练语言模型,它通过两个预训练任务,使用裁剪的相对位置嵌入来处理文档布局的关系,能够无需图像模态高效处理任意长度序列,且在多个下游任务上取得了优越表现。
PDF
2 years ago
LAMPRET:面向布局的多模态文档预训练理解
本论文提出了一种基于多模态 Transformer 的分层框架(LAMPreT),并通过分层预训练来训练模型,以实现对文档布局的理解及其内部内容的分类和组合,来更好地进行文本块填充和图像建议两项任务。
PDF
3 years ago
递归自编码器用于文档布局生成
本文提出了一种名为 READ 的新框架,利用递归自动编码器生成大量和多样的文档 2D 布局,其中采用了一种递归的方法来提取文档的结构分解,并利用标注边界框的文档数据集对此进行了学习,从而获得了结构表示形式,并将其映射到高斯空间,从而生成新的
→
PDF
5 years ago
Prev
Next