BriefGPT.xyz
大模型
Ask
alpha
关键词
document information extraction
搜索结果 - 4
ICL-D3IE: 基于上下文学习与多样化演示更新的文档信息提取
本文提出了一种名为 ICL-D3IE 的简单有效的上下文学习框架,该框架使得大型语言模型(如 GPT-3 和 ChatGPT)能够在文档信息提取方面使用不同类型的演示示例进行 DIE,包括提取难处理文档中最困难和独特的章节作为强演示,通过迭
→
PDF
a year ago
ACL
GMN: 实用文档信息提取的生成式多模型网络
该论文提出了一种面向实际场景的多模态生成方法 GMN,利用空间编码器和模态感知掩模模块处理复杂文档的噪声 OCR 结果或可变布局,并避免了字符级注释,实验证明 GMN 在公共 DIE 数据集上取得了新的最佳性能,并且在现实场景中优于其他方法
→
PDF
2 years ago
商业文件信息提取:朝着实用基准的方向
本文研究信息提取的问题,探讨了文档信息提取问题、数据集、基准测试等方面,提出了机器学习中的关键信息定位、提取和条目识别问题,并批评了目前缺乏半结构化商务文档的相关数据集和基准测试。
PDF
2 years ago
从文档中进行端到端信息提取 -- 出席、复制、解析
本文提出了一种深度神经网络模型 ——Attend,Copy,Parse,该模型可直接在端到端数据上进行训练,跳过了创建复杂的单词级标签的需求,因此被认为在许多现实生活信息提取任务中可以使用。
PDF
6 years ago
Prev
Next