ICCVSep, 2023

关注关键部分:选择性区域集中下的视觉文档理解

TL;DR我们提出了一种新颖的端到端文档理解模型,称为 SeRum(选择性区域理解模型),用于从文档图像中提取有意义的信息,包括文档分析、检索和办公自动化。