Sep, 2019

递归自编码器用于文档布局生成

TL;DR本文提出了一种名为 READ 的新框架,利用递归自动编码器生成大量和多样的文档 2D 布局,其中采用了一种递归的方法来提取文档的结构分解,并利用标注边界框的文档数据集对此进行了学习,从而获得了结构表示形式,并将其映射到高斯空间,从而生成新的文本布局,同时,还引入了一种组合度量来测量文档布局之间的结构相似性,并证明了所生成文档布局的高可变性和实际性,在文本检测任务中证明了所生成布局的作用。