Mar, 2022

ASET: 文本集合的即席结构化探索 [扩展摘要]

TL;DR本文提出了一种名为 ASET 的新系统,允许用户以特定方式对文本集合进行结构化探索,使用含有命名实体识别器的现有抽取器首先从文本中提取信息,并使用嵌入依据用户的要求将抽取匹配到结构化表定义中,评估结果显示,ASET 能够高质量地从真实文本集合中抽取结构化数据,而无需事先设计抽取流程。