BriefGPT.xyz
Ask
alpha
关键词
machine-readable
搜索结果 - 3
使用多阶段流程进行表格检测和表格结构识别的多类型 TD-TSR —— 从 OCR 到结构化表格表示中提取文档图像的表格
本研究提出了一种名为 Multi-Type-TD-TSR 的多阶段流水线,可实现表格检测和结构识别的端对端解决方案,利用深度学习模型实现表格检测和区分边框的三种不同类型的表格。在 ICDAR 2019 表格结构识别数据集上进行评估,实现了新
→
PDF
3 years ago
EMNLP
针对濒危语言文本的 OCR 后校正
针对极度濒危语言中大多数没有用于构建自然语言处理模型的数据的情况,本文提出了一种从不可读的文本数据中提取文本的方法,具体而言,在三种极度濒危的语言中创建了一个基准数据集,并针对数据不足的 OCR 研究有效性做了系统分析,开发了一种针对数据不
→
PDF
4 years ago
AAAI
EmojiNet:一个开放的服务和 API 用于寻找表情符号的意义
该研究介绍了 EmojiNet,这是最大的机器可读表情符号意义库,它将从网络中提取的 Unicode 表情符号与其对应的英文含义相关联。该数据集包括:(i)12,904 个语境标签,涵盖 2,389 个表情符号,这些标签从 Web 中提取并
→
PDF
7 years ago
Prev
Next