过去 20 年中判例检索的问题、方法、挑战和评估
通过将专业的法律知识与大型语言模型相结合,KELLER 引入了一种基于大型语言模型的法律案例重构方法,用于实现有效和可解释的法律案例检索,并在两个法律案例检索基准上展示了 KELLER 相比现有方法在复杂法律案例查询方面的卓越性能和鲁棒性。
Jun, 2024
通过研究案例检索中用户意图,本文提出了一个新颖的层次意图分类法,将法律案例检索任务划分为五种不同的意图类型。通过实验研究,揭示了不同意图下用户行为和满意度的显著差异,并将所提出的分类法应用于案例排序和满意度预测等任务中,展示了其有效性。该研究对于理解法律案例检索中用户意图具有重要的洞察力,并有望促进法律领域中更好的检索技术发展。
Jul, 2023
我们提出了一种结合自然语言处理和机器学习技术的方法,通过创建文本嵌入来增强法律案例描述的组织和利用,实现无监督聚类和有监督引文检索,以自动化提取引文的过程,从而实现更高效、节省时间、便捷的法律研究和论证。
May, 2024
本文使用自然语言处理技术,比较了基于关键词和逻辑运算符的传统方法与基于 Claude 2 大型语言模型的创新方法,在英国法院裁决案例的大语料库中提取总结性判决案例。结果表明,大语言模型的加权 F1 得分为 0.94,而关键词法的得分仅为 0.78,说明大语言模型在捕捉法律语言中的细微差别方面更加有效。本文展示了先进自然语言处理技术在核心法律研究任务中的应用,并且阐明了这些技术如何填补系统性差距并提升法律信息的可获取性。同时,我们分享了提取的数据集度量,以支持进一步的总结性判决研究。
Mar, 2024
提出了一种基于交互式多视图对比学习目标的法律案例检索网络,其中对比学习的视图包括案例视图和元素视图,以最小化由预训练语言模型编码器生成的相关法律案例表示之间的隐藏空间距离,并通过改变案例的法律元素来建立正负实例以帮助网络更好地计算法律相关性,实验证明其在相关案例检索基准上获得了显着的改进。
Oct, 2022
利用大型语言模型进行相关判决的准确性研究,提出了一种适用于法律案例相关判决的新型工作流程,并通过与人工专家判断的比较,证明了该工作流程可以获得可靠的相关判决,并通过大型语言模型生成的数据综合增强现有的法律案例检索模型的能力。
Mar, 2024
针对从法律判决中提取相关段落的任务,本文构建了一个专门的数据集,并评估了当前检索模型的性能,同时还使用不同模型建立了微调基准。结果突显了微调和零 - shot 方法之间的显著差距,强调了处理法律领域中分布偏移的挑战。本文还探讨了各种参数高效微调方法,并在信息检索的背景下评估了它们的实用性,为不同预训练和模型架构选择参数高效微调方法提供了启示。
Mar, 2024
本文对不同类型的文本摘要模型(如抽取式与生成式模型)在法律文本中的表现进行分析,特别是将最近的基于 transformer 的生成式摘要模型应用于法律文本摘要时,由于法律文档非常长,必须考虑这些模型的限制。同时,本文还提供了在针对法律文档进行摘要系统评估方面的一些有用结论。
Oct, 2022
我们提出了一种名为 PILOT(PredictIng Legal case OuTcome)的新模型,用于案例结果预测。该模型由相关案例检索和时间模式处理两个模块组成,通过对大规模案例数据库进行实验,我们展示了准确识别先例案例和缓解时间转移对案例法预测的重要性,并显示出显著改进,超过之前专注于民事案件结果预测的方法。
Jan, 2024