May, 2023

FormNetV2:面向表单文件信息提取的多模态图形对比学习

TL;DRFormNetV2引入了一种集中的多模态图形对比学习策略,将自监督预训练统一为一个损失,通过提取与图形边缘相连的一对令牌之间的边界框内的图像特征,捕捉更有针对性的视觉线索,从而在FUNSD、CORD、SROIE和Payment基准测试上建立新的最先进性能。