ACLAug, 2018

利用同义词聚类的半监督事件抽取

TL;DR提出一种通过引入自主训练数据的自训练事件抽取系统的方法,它利用了跨多个来源的新闻文章中同一事件实例的多个提及的出现。在这个集群中,如果我们的系统能从一些提及中进行高置信度的抽取,那么它可以通过添加其他提及来获取多样化的培训示例。该方法对 ACE2005 和 TAC-KBP 2015 数据集上的多个事件提取器显示出显着的性能改进。