May, 2022

一种基于 Zipf 定律的从文档中提取实体的方法

TL;DR本研究提出了使用 Zipf 定律来解决文本中出现的目录不平衡问题,通过文本生成模型,将文档中常见和少见的实体词汇分类,标记少见实体,并在人工设计规则的帮助下,对工业安全技术文档中的实体进行提取,并通过实验结果证明该方法的有效性。