民事诉讼中的法律论证任务

EMNLPNov, 2022

The Legal Argument Reasoning Task in Civil Procedure

Leonard Bongard, Lena Held, Ivan Habernal

TL;DR本文介绍了一个新的自然语言处理任务和数据集，基于美国民事诉讼领域，旨在为评估现代法律语言模型提供具有挑战的任务。研究表明，fine-tuning 法律 transformer 模型相对于随机基线模型更有优势，但推理法律论点的实际能力仍是具有挑战性的开放性研究问题。

Abstract

We present a new nlp task and dataset from the domain of the U.S. civil procedure. Each instance of the dataset consists of a general intr

nlp task civil procedure dataset legal language models transformer

发现论文，激发创造

SemEval2024 任务 5：民事诉讼中的合法论证任务中的渴望学习者

该研究通过比较不同方法，调查了零样本方法在使用三种大型语言模型、两种具有大输入标记尺寸的模型和两种预训练的法律数据模型进行数据分类方面的表现。我们的主要数据集来自美国民事诉讼领域，包括法律案例摘要、具体问题、潜在答案和详细解释，这些都是从一本针对法律学生的书中获取的。通过这些实验，我们的发现展示了大型语言模型的零样本方法如何有效理解复杂数据，我们在实验中取得了最高的 F1 得分，达到了 64%。

Jun, 2024

UTSA-NLP 团队参加 SemEval 2024 任务 5：使用 GPT4 进行民事诉讼中的论证推理的提示集成

我们通过使用 GPT4 进行基于提示的解决方案来推理法律论点，同时评估了一系列提示策略的集成，包括思维链推理和上下文学习。在验证数据集上，我们的系统获得了.8095 的宏 F1 值，在最终测试集中排名第 5（21 个团队中）。

Apr, 2024

Archimedes-AUEB 参与 SemEval-2024 任务 5：LLM 解释民事诉讼程序

使用强大的 ChatGPT 模型作为教师模型，通过生成解释和合成数据来扩展训练数据集，并利用生成的数据微调一个小型学生模型。与以往的工作不同，我们的解释不是直接来自教师模型的内部知识，而是基于真实人类分析，从而提供出更优的推理信号。还使用一种新的 “变异” 方法生成受现有数据启发的人工数据实例。我们公开发布这些解释作为原始数据集的扩展，以及用于生成两者的提示。我们的系统在 SemEval 比赛中排名第 15 位。它的性能优于自身教师模型，并且能够生成与原始人类分析一致的解释，经过法律专家验证。

May, 2024

加州圣塔克鲁兹大学在 SemEval-2024 第 5 项任务中的自然语言处理：使用少样本多选题进行法律答案验证

本文介绍了我们在 SemEval 2024 任务 5 中提出的内容：民事诉讼中的法律争议推理任务。我们提出了解决法律答案验证问题的两种方法：首先，对预训练的 BERT 模型进行了微调，并发现基于领域知识训练的模型效果更好；其次，我们对 GPT 模型进行了少样本提示，发现将答案验证任务改为多项选择问题显著提高了模型的性能。我们的最佳模型是基于 BERT 的模型，在 20 个参赛作品中取得了第 7 名。

Apr, 2024

用于基于理由支持的法律判决预测的日本侵权案例数据集

该研究提出了用于日本法律判决预测的首个数据集，即日本侵权案例数据集（JTD），其中包含二个任务：侵权预测和相关性抽取。JTD 基于 41 名法律专家对 3477 个日本民法判决进行了标注，共获得 7978 个实例和 59697 个涉案方的主张。实验结果表明所提出的两个任务的可行性，并且通过法律专家的错误分析确定了错误来源并提出了未来的研究方向。

Dec, 2023

法院判决中的法律论点挖掘

该研究探讨了法律文本中的论点自动提取与语义分析方法，采用基于欧洲人权法院纪录的一种新的注释方案，提出了一种改进的模型，能够更加准确地对法律审判过程中的论点进行自动化提取与分类。

Aug, 2022

构建多层次摘要的无监督法律文本问答系统

本文总结了团队 SCaLAR 在《SemEval-2024 任务 5：民事诉讼中的法律论证》方面的工作。我们提出了一种简单而又新颖的基于相似度和距离的无监督方法来生成标签，以解决该二元分类任务。此外，我们通过使用 CNN、GRU 和 LSTM 等集成特征和多级融合的 Legal-Bert 嵌入来探索解决法律文本复杂性的问题。为了解决数据集中冗长的法律解释，我们引入了基于 T5 的分段摘要，成功保留了关键信息，提高了模型的性能。我们的无监督系统在开发集上的宏 F1 得分增加了 20 个百分点，在测试集上增加了 10 个百分点，这是一个令人鼓舞的结果，考虑到其简单的架构。

Mar, 2024

支持法律论证的自然语言处理：真的只需要更多数据吗？

对于模拟法律推理和案例论证以支持决策的论文进行了回顾，揭示了传统符号逻辑与 AI 技术，并探讨了在法律自然语言处理方面的最新进展，提出融入专家知识以在符号逻辑和数据驱动方法中保持可拓展性和解释性的可能性，同时识别出挑战和现代自然语言处理模型和方法的潜力。

Jun, 2024

利用领域预训练和神经网络增强法律论证挖掘

本文对传统词嵌入模型与 BERT 模型在人权法庭裁决文本的法条分析任务中的表现进行了比较，实验证明领域特定的 BERT 模型有很大的潜力，而传统的词嵌入模型在与神经网络层结合后也能表现出很强的性能。

Feb, 2022

SemEval 2023 任务 6：LegalEval - 理解法律文本

该论文探讨了 Legal NLP 领域的研究，分析了 SemEval 举办的 LegalEval 任务的三个子任务：语言角色标注，法律实体识别和法院判例预测，并总结了 26 个团队的研究成果。

Apr, 2023