Apr, 2022

文档理解的统一预训练框架

TL;DRUDoc 是一个新的文档理解的统一预训练框架,它通过使用三个自监督损失约束表示模型,将单词和视觉特征作为输入,使神经网络从无标签的数据中学习到更好的文档表示,并取得了下游任务的提升。