ACLMay, 2019

极端多标签法律文本分类:欧盟立法案例研究

TL;DR本文讨论在法律领域中进行的极端多标签文本分类(XMTC)任务,并发布了一个新的数据集,其中包含 57k 份来自欧洲公共文档数据库 EURLEX 的立法文件,注释了来自多学科词库 EUROVOC 的概念。本文实验了几种神经分类器,表明采用 self-attention 的 BIGRUs 优于目前使用基于标签的注意力的多标签最先进方法。用 BIGRUs 替换 CNN 在基于标签的注意力网络中,从而获得了最佳的整体性能。