Jun, 2024

跨数据集和语言学习开放式命名实体识别的通用实体分类

TL;DR通过构建一个通用的、包含400多种实体类型的数据集B2NERD,并使用减少冗余的数据修剪策略,在开放领域命名实体识别方面,提高了大型语言模型的泛化性能,优于GPT-4和以往的方法。