Oct, 2023

LEEC:一份带有广泛领域特定标签系统的法律元素提取数据集

TL;DR在法律领域中,元素提取作为自然语言处理的重要任务之一,从司法文件中提取法律要素有助于增强对法律案例的解释和分析能力,进而促进法律领域各个方面的下游应用。通过引入一个更全面、大规模的刑事法律要素提取数据集,本研究解决了现有数据集的限制问题,该数据集由15831个司法文件和159个标签组成,并通过专家设计的标签系统和注释准则进行构建。LEEC数据集是目前为中国法律系统最广泛且专业的法律要素提取数据集,利用标注的数据,我们运用各种最先进的模型验证了LEEC在文档事件提取任务中的适用性。