May, 2023
FormNetV2:面向表单文件信息提取的多模态图形对比学习
FormNetV2: Multimodal Graph Contrastive Learning for Form Document
Information Extraction
TL;DRFormNetV2引入了一种集中的多模态图形对比学习策略,将自监督预训练统一为一个损失,通过提取与图形边缘相连的一对令牌之间的边界框内的图像特征,捕捉更有针对性的视觉线索,从而在FUNSD、CORD、SROIE和Payment基准测试上建立新的最先进性能。