Feb, 2024

使用 LLMs 创建细粒度实体类型分类法

TL;DR通过使用 GPT-4 和其高级版本 GPT-4 Turbo,本研究探讨了它们在自主开发详细实体类型分类系统方面的潜力。我们的目标是构建一个全面的分类系统,从广泛的实体类型分类开始,包括对象、时间、地点、组织、事件、行动和主题等,类似于现有的手动定义的分类系统。通过迭代的提示技术,利用 GPT-4 内部的知识库,逐步完善这一分类系统。结果是一个包含超过 5000 个精细实体类型的广泛分类系统,在主观评估中表现出了卓越的质量。我们采用了一种简单而有效的提示策略,使分类系统能够动态扩展。这个详细分类系统的实际应用非常广泛且重要。它通过基于模式的组合,有助于创建新的复杂分支,显著提升信息提取任务,如关系提取和事件参数提取。我们的方法不仅为分类系统的创建引入了创新性方法,还为在各种计算语言学和人工智能相关领域应用该分类系统开辟了新的途径。