ACLAug, 2021

重新思考负采样来处理缺失实体注释

TL;DR本文介绍了关于如何使用负采样处理命名实体识别任务的缺失注释的分析和改进方法,通过引入 missampling 和 uncertainty 两个概念,实验证明负采样的低错误率和高不确定性是实现良好表现的关键,并提出了一种自适应和加权采样方法提高了负采样性能,证明在合成数据集以及 CoNLL-2003 数据集中,改进后的负采样方法能够提高 F1 得分且 loss 收敛速度更快,更进一步在实际数据集比如 EC 上取得了最新的最佳效果。