MMAug, 2022

利用文本分析和版面特征从扫描的发票图像中提取信息

TL;DROCRMiner 系统使用文本分析技术与布局特征相结合的方法从扫描文档图像中提取 (半) 结构化文档的索引元数据。该系统由多个相互连接的模块组成,使用开源 OCR 系统,其英文数据召回率达 90%,捷克语数据召回率为 88%。