May, 2024

检索增强的结构化生成:以工商文档信息提取为工具使用

TL;DR商业文档信息提取(BDIE)是将一大段非结构化信息(原始文本、扫描文档等)转换为下游系统可以解析和使用的结构化格式的问题。本文提出了一种名为 RASG 的检索增强结构化生成的新的 BDIE 框架,它在 BDIE 基准测试中实现了最先进的 KIE 任务和 LIR 任务的结果。