CVPRMar, 2023

采用视觉对齐序列坐标建模提升表格结构识别

TL;DR提出了一种名为 VAST 的表结构识别框架,其中包含一个新颖的坐标序列解码器以及一个辅助的视觉对齐损失。通过该框架,可以实现在逻辑和物理结构识别方面的最先进的结果。