Jun, 2021

SelfDoc: 自我监督文件表示学习

TL;DRSelfDoc是一个文档图像理解的任务无关的预训练框架,利用文档的位置、文本和视觉信息,并建模内容块之间的上下文关系,提出了一种新的跨模态学习模型,优于现有模型,同时具有自适应的视觉语言融合机制并应用自监督模型预训练,与以前作品相比,使用较少的文档图片达到更好的性能。