LePaRD: 一个大规模的法官引用判例数据集
智能法律系统中的重要组成部分,法律案例检索在确保司法公正和公平方面起着关键作用。为了解决现有数据集中的三个问题,本研究介绍了一个大规模的法律案例检索数据集 LeCaRDv2,并丰富了现有的相关性标准,同时提出了一个有效识别潜在候选项的候选集合策略。在 LeCaRDv2 上评估了多个检索模型,表明法律案例检索仍有很大的改进空间。
Oct, 2023
通过转化一个大型开源法律语料库为数据集,我们构建了 CLERC(Case Law Evaluation Retrieval Corpus)数据集,用于培训和评估智能系统在寻找相关引用和编写支持推理目标的连贯分析方面的能力。我们在 CLERC 上对最先进的模型进行了基准测试,结果表明目前的方法仍然存在困难。
Jun, 2024
该论文通过分析 31 个 LJP 数据集、总结 14 个数据评估指标、回顾 12 个预训练模型以及挑选 8 个代表性数据集呈现状态,以帮助读者了解 LJP 的现状并促进 NLP 研究和法律专业人士的进一步合作。
Apr, 2022
利用先例加强的 LJP 框架(PLJP)结合了大型语言模型和领域模型的优势,能够有效地预测案件的判决结果,并展示了 LLM 和领域模型协作的有希望的方向。
Oct, 2023
本文介绍了 CAIL2018 挑战数据集,以及其中包含的中国法律判例数据,分析了现有文本分类方法在预测判决结果方面的挑战,特别是在刑期上的预测还有待改进。
Jul, 2018
该研究提出了用于日本法律判决预测的首个数据集,即日本侵权案例数据集(JTD),其中包含二个任务:侵权预测和相关性抽取。JTD 基于 41 名法律专家对 3477 个日本民法判决进行了标注,共获得 7978 个实例和 59697 个涉案方的主张。实验结果表明所提出的两个任务的可行性,并且通过法律专家的错误分析确定了错误来源并提出了未来的研究方向。
Dec, 2023
本研究通过多任务学习将案件中的原告索赔、法庭辩论数据进行全面理解,以更准确地预测司法裁决。实验结果表明,该模型相较于强有力的基线算法,具备更好的判决质量和效率,被真实法官和法学生用于实践并证明其具有更好普适性和解释性。
Jul, 2021
我们提出了一种结合自然语言处理和机器学习技术的方法,通过创建文本嵌入来增强法律案例描述的组织和利用,实现无监督聚类和有监督引文检索,以自动化提取引文的过程,从而实现更高效、节省时间、便捷的法律研究和论证。
May, 2024
通过多语言的法律案例数据集,使用 BERT 模型,成功预测了瑞士联邦最高法院的裁决案例,提高了司法工作效率。
Oct, 2021
本文在考虑高风险决策领域如何利用深度学习解决实际问题的情况下,设计了一个法律引用预测任务,利用先例和立法规定为参考,引入用户反馈并且添加可解释性,最终达到了律师使用的决策参数,并建立在最先进的法律语言处理模型和实际社会影响的关键考虑上。
May, 2023