Jun, 2024

使用数据增强的嵌套命名实体识别的复合嵌套学习

TL;DR本研究关注于基于嵌套命名实体识别(NNER)来解决实体重叠识别的问题,提出了一种有效的数据增强方法,使用 Composited-Nested-Label Classification(CNLC)来建模嵌套实体,通过 Composited-Nested-Learning(CNL)对数据集进行扩充,并采用 Confidence Filtering Mechanism(CFM)对生成的数据进行高效选择,实验证明该方法在 ACE2004 和 ACE2005 中取得了改进,并缓解了样本不平衡所带来的影响。