May, 2023

通过稀疏图分割实现非受控条件下的文本阅读顺序

TL;DR本文提出了一种轻量、可扩展和通用的方法,通过运行在稀疏布局基础图上的多模态、多任务图卷积网络(GCN)来识别文本阅读顺序,并使用后处理聚类和排序算法生成所有文本行的有序序列。