LePaRD: 一个大规模的法官引用判例数据集

Nov, 2023

LePaRD: 一个大规模的法官引用判例数据集

LePaRD: A Large-Scale Dataset of Judges Citing Precedents

Robert Mahari, Dominik Stammbach, Elliott Ash, Alex `Sandy' Pentland

TL;DR我们介绍了法律文书检索数据集 LePaRD，该数据集是美国联邦司法引文的巨大集合，旨在促进法律文书预测的工作。

Abstract

We present the legal passage retrieval dataset LePaRD. LePaRD is a massive collection of u.s. federal judicial citations to precedent in context. The dataset aims to facilitate work on →

legal passage retrieval dataset u.s. federal judicial citations legal passage prediction precedential court decisions legal nlp task

发现论文，激发创造

LeCaRDv2：一个大规模的中文法律案例检索数据集

智能法律系统中的重要组成部分，法律案例检索在确保司法公正和公平方面起着关键作用。为了解决现有数据集中的三个问题，本研究介绍了一个大规模的法律案例检索数据集 LeCaRDv2，并丰富了现有的相关性标准，同时提出了一个有效识别潜在候选项的候选集合策略。在 LeCaRDv2 上评估了多个检索模型，表明法律案例检索仍有很大的改进空间。

Oct, 2023

CLERC: 法律案件检索数据集及检索增强分析生成

通过转化一个大型开源法律语料库为数据集，我们构建了 CLERC（Case Law Evaluation Retrieval Corpus）数据集，用于培训和评估智能系统在寻找相关引用和编写支持推理目标的连贯分析方面的能力。我们在 CLERC 上对最先进的模型进行了基准测试，结果表明目前的方法仍然存在困难。

Jun, 2024

论法律判决预测：数据集、评估指标、模型与挑战

该论文通过分析 31 个 LJP 数据集、总结 14 个数据评估指标、回顾 12 个预训练模型以及挑选 8 个代表性数据集呈现状态，以帮助读者了解 LJP 的现状并促进 NLP 研究和法律专业人士的进一步合作。

Apr, 2022

利用 LLM 与领域模型合作增强的法律判决预测

利用先例加强的 LJP 框架（PLJP）结合了大型语言模型和领域模型的优势，能够有效地预测案件的判决结果，并展示了 LLM 和领域模型协作的有希望的方向。

Oct, 2023

CAIL2018：用于判决预测的大规模法律数据集

本文介绍了 CAIL2018 挑战数据集，以及其中包含的中国法律判例数据，分析了现有文本分类方法在预测判决结果方面的挑战，特别是在刑期上的预测还有待改进。

Jul, 2018

用于基于理由支持的法律判决预测的日本侵权案例数据集

该研究提出了用于日本法律判决预测的首个数据集，即日本侵权案例数据集（JTD），其中包含二个任务：侵权预测和相关性抽取。JTD 基于 41 名法律专家对 3477 个日本民法判决进行了标注，共获得 7978 个实例和 59697 个涉案方的主张。实验结果表明所提出的两个任务的可行性，并且通过法律专家的错误分析确定了错误来源并提出了未来的研究方向。

Dec, 2023

真实法庭环境下的多阶段案件表征学习法律判决预测

本研究通过多任务学习将案件中的原告索赔、法庭辩论数据进行全面理解，以更准确地预测司法裁决。实验结果表明，该模型相较于强有力的基线算法，具备更好的判决质量和效率，被真实法官和法学生用于实践并证明其具有更好普适性和解释性。

Jul, 2021

利用上下文相似性进行判决引用检索

我们提出了一种结合自然语言处理和机器学习技术的方法，通过创建文本嵌入来增强法律案例描述的组织和利用，实现无监督聚类和有监督引文检索，以自动化提取引文的过程，从而实现更高效、节省时间、便捷的法律研究和论证。

May, 2024

Swiss-Judgment-Prediction: 多语言法律判决预测基准

通过多语言的法律案例数据集，使用 BERT 模型，成功预测了瑞士联邦最高法院的裁决案例，提高了司法工作效率。

Oct, 2021

基于原型的法律引用预测可解释性

本文在考虑高风险决策领域如何利用深度学习解决实际问题的情况下，设计了一个法律引用预测任务，利用先例和立法规定为参考，引入用户反馈并且添加可解释性，最终达到了律师使用的决策参数，并建立在最先进的法律语言处理模型和实际社会影响的关键考虑上。

May, 2023