BriefGPT.xyz
Jun, 2021
SelfDoc: 自我监督文件表示学习
SelfDoc: Self-Supervised Document Representation Learning
HTML
PDF
Peizhao Li, Jiuxiang Gu, Jason Kuen, Vlad I. Morariu, Handong Zhao...
TL;DR
SelfDoc是一个文档图像理解的任务无关的预训练框架,利用文档的位置、文本和视觉信息,并建模内容块之间的上下文关系,提出了一种新的跨模态学习模型,优于现有模型,同时具有自适应的视觉语言融合机制并应用自监督模型预训练,与以前作品相比,使用较少的文档图片达到更好的性能。
Abstract
We propose SelfDoc, a task-agnostic
pre-training framework
for
document image understanding
. Because documents are multimodal and are intended for sequential reading, our framework exploits the positional, textua
→