Apr, 2019

超越标签噪声:远程监督关系提取中的标签分布转移问题

TL;DR本文针对远程监督(DS)- 训练数据自动生成实体抽取的问题进行了研究,发现了标签分布改变对性能的影响,并提出了一种基于偏差调整的方法。实验证明调整偏差能够提高DS训练模型的性能,尤其是神经网络模型,相对F1值提高最高可达23%。