May, 2023

异构表的基于 Schema 的信息提取

TL;DR本论文探讨了语言模型是否能够支持从复杂表格中进行成本有效的信息提取,并引入了基于架构驱动信息提取的新任务,使用 LLMs 将表格数据转换成遵循人类撰写的架构的结构化记录,并发展了一种 InstrucTE 方法来实现表格抽取,该方法仅需要人工构建的抽取架构,并具备错误恢复策略及高性能,证实了使用更紧凑的抽取模型进行抽取的可行性。