BriefGPT.xyz
Ask
alpha
关键词
layout features
搜索结果 - 3
MM
利用文本分析和版面特征从扫描的发票图像中提取信息
OCRMiner 系统使用文本分析技术与布局特征相结合的方法从扫描文档图像中提取 (半) 结构化文档的索引元数据。该系统由多个相互连接的模块组成,使用开源 OCR 系统,其英文数据召回率达 90%,捷克语数据召回率为 88%。
PDF
2 years ago
使用自上而下和自下而上线索的表格结构识别
本研究提出了一种识别具有复杂结构,密集内容和不同布局的表格的方法,其不依赖于元特征和 OCR,并结合单元检测和交互模块来本地化细胞并预测它们与其他检测到的单元的行和列关联,同时将结构约束作为细胞检测损失函数的附加差分组件,从而将自上而下和自
→
PDF
4 years ago
LAMBERT: 面向布局的(语言)建模用于信息提取
在 OCR 系统获取的布局特征的基础上,改进 Transformer 编码器的结构来构建布局感知的语言模型,展示在信息提取方面的出色性能。
PDF
4 years ago
Prev
Next