ACLApr, 2019

具有歧义的众包框架消歧语料库

TL;DR使用众包方法对维基百科语料库中的 5,000 个词语 - 句子对进行了 FrameNet 语义框架消歧的资源建设,提供了一个基于不同独立注释者之间互相不同意见的置信度分数的框架列表,强调了语义框架之间的重叠和不确定性对于训练和评估自然语言处理系统的重要性,同时使用 Framester 系统提供的扩展词形集完成数据处理。