合适的模型：法律多标签分类基线的评估

Jan, 2024

合适的模型：法律多标签分类基线的评估

The Right Model for the Job: An Evaluation of Legal Multi-Label Classification Baselines

Martina Forster, Claudia Schulz, Prudhvi Nokku, Melicaalsadat Mirsafian, Jaykumar Kasundra...

TL;DR在这项工作中，我们使用两个公共法律数据集 POSTURE50K 和 EURLEX57K，通过改变训练数据量和标签数量，评估了不同的多标签分类方法，结果显示 DistilRoBERTa 和 LegalBERT 在法律多标签分类中表现良好，而 T5 在生成模型中表现相当，并且 CrossEncoder 在提高宏 F1 分数方面具有潜力，尽管计算成本增加。

Abstract

multi-label classification (MLC) is a common task in the legal domain, where more than one label may be assigned to a legal document. A wide range of methods can be applied, ranging from traditional ML approaches

multi-label classification legal domain mlc methods distilroberta crossencoder

发现论文，激发创造

欧盟立法上的大规模多标签文本分类

该研究在法律领域考虑了大规模多标签文本分类，提出了一个适用于 LMTC、few - 和 zero-shot 学习的新数据集 EURLEX，共包含 57k 个法律文档，注释有～4.3k 个 EUROVOC 标签；实验表明，具有标签注意力的 BIGRU 模型优于当前其他最先进的模型；领域特定的 WORD2VEC 和上下文敏感的 ELMO 嵌入进一步提高了性能；研究人员还发现，只考虑文档中的特定区域就足够了，这使得我们可以规避 BERT 的最大文本长度限制，并使用 fine-tune BERT 在所有情况下获得了最佳结果。

Jun, 2019

极端多标签法律文本分类：欧盟立法案例研究

本文讨论在法律领域中进行的极端多标签文本分类（XMTC）任务，并发布了一个新的数据集，其中包含 57k 份来自欧洲公共文档数据库 EURLEX 的立法文件，注释了来自多学科词库 EUROVOC 的概念。本文实验了几种神经分类器，表明采用 self-attention 的 BIGRUs 优于目前使用基于标签的注意力的多标签最先进方法。用 BIGRUs 替换 CNN 在基于标签的注意力网络中，从而获得了最佳的整体性能。

May, 2019

检索增强多标签文本分类

本文提出了一种检索增强的方法来解决具有 Zipfian 分布标签支持的大标签集情况下的多标签文本分类问题，并通过交叉关注和检索来改善分类模型的样本效率，实验证明这种方法在标签分布偏斜、低资源训练和长文档数据情境下显著提高了模型性能。

May, 2023

多标签分类方法的综合比较研究

这项研究对各个领域的大量数据集使用 20 种不同的评估方法对 26 种不同的多标签分类方法进行了全面的实证研究，发现 RFPCT，RFDTBR，ECCJ48，EBRJ48 和 AdaBoostMH 是效果最好的方法，希望今后引入新方法时，应该将其与不同的 MLC 方法的子集进行比较，以便更好地评估其性能表现。

Feb, 2021

针对法律和生物医学文本的编码器 - 解码器多标签分类方法探究

本研究比较了四种多标签分类方法，其中两种基于编码器，两种基于编码器 - 解码器。结果表明，在多个数据集上使用编码器 - 解码器方法比仅编码器表现更好，其非自回归编码器 - 解码器方法获得了最优表现。

May, 2023

对法律判决预测的大型语言模型的全面评估

研究了大型语言模型在法律领域的应用，通过设计基于大型语言模型的实用基准解决方案，并在法律判决预测任务上测试，发现类似案例和多项选择选项对大型语言模型的领域知识回忆至关重要，同时也揭示了信息检索系统在某些情况下超过了大型语言模型与信息检索系统的组合，从而使大型语言模型的角色变得多余。

Oct, 2023

探索大型语言模型和分层框架用于大规模非结构化法律文件的分类

通过使用多级编码器层次框架（MESc）以及大型语言模型和无监督聚类方法，我们研究了在没有结构注释的情况下，从大型法律文件中预测裁决的问题，并测试了这些方法在法律领域的转移学习能力和效果，我们的方法相较于之前的最先进方法取得了至少 2 个性能指标的增益。

Mar, 2024

基于 Transformer 的实体法律形式分类

使用 Transformer-based 的语言模型对原始的法人实体名称进行实体法律形式分类，通过与多个传统基准进行比较，我们发现预训练的 BERT 变种在 F1 得分方面优于传统文本分类方法，并在宏 F1 得分方面表现良好。此外，通过在十个选定的法域中进行的第三方专家评审的结果支持我们的提议。该研究突出了 Transformer-based 模型在推进数据标准化和数据集成方面的巨大潜力，这些方法可以极大地有助于金融机构、公司、政府和其他组织评估业务关系、理解风险暴露和促进有效治理。

Oct, 2023

构建多层次摘要的无监督法律文本问答系统

本文总结了团队 SCaLAR 在《SemEval-2024 任务 5：民事诉讼中的法律论证》方面的工作。我们提出了一种简单而又新颖的基于相似度和距离的无监督方法来生成标签，以解决该二元分类任务。此外，我们通过使用 CNN、GRU 和 LSTM 等集成特征和多级融合的 Legal-Bert 嵌入来探索解决法律文本复杂性的问题。为了解决数据集中冗长的法律解释，我们引入了基于 T5 的分段摘要，成功保留了关键信息，提高了模型的性能。我们的无监督系统在开发集上的宏 F1 得分增加了 20 个百分点，在测试集上增加了 10 个百分点，这是一个令人鼓舞的结果，考虑到其简单的架构。

Mar, 2024

西班牙法律判决的可解释机器学习多标签分类

提出了一个将人工智能、机器学习、自然语言处理与深度法律推理结合的混合系统，用于法律判决的多标签分类和解释，通过提供自然语言解释来减轻法律专家的重复劳动密集型法律分类任务。

May, 2024