COLINGApr, 2024

CMNEE:基于开源中国军事新闻的大规模文档级事件抽取数据集

TL;DR提取军事文本中的结构化事件知识,包括事件触发器和相应的参数,对于许多应用非常重要,如情报分析和决策辅助。本研究提出了 CMNEE,一个大规模的、以文件级别为单位的开源中国军事新闻事件提取数据集,包含 17,000 个文档和 29,223 个事件,这些事件均按照事先定义的军事领域模式进行手动注释,包括 8 种事件类型和 11 种参数角色类型。与其他领域数据集相比,对 CMNEE 的实验结果明显不理想,这表明军事领域的事件提取面临独特挑战,需要进一步的研究努力。可从此 https URL 获取我们的代码和数据。