通过将专业的法律知识与大型语言模型相结合,KELLER 引入了一种基于大型语言模型的法律案例重构方法,用于实现有效和可解释的法律案例检索,并在两个法律案例检索基准上展示了 KELLER 相比现有方法在复杂法律案例查询方面的卓越性能和鲁棒性。
Jun, 2024
本研究总结了 2023 年 COLIEE 中冠军团队 THUIR 的方法,其中使用结构感知的预训练语言模型来加强对法律案例的理解,借助启发式预处理和后处理方法减少不相关信息的影响,并利用学习排序的方法来合并具有不同维度的特征,实验证明了该方法的优越性。
May, 2023
在法律案例检索中,利用预训练语言模型的有效性已得到研究证明。然而,现有工作大多侧重于提高上下文嵌入的表示能力,并使用文本语义相似性计算相关性。本研究引入 DELTA,一种针对法律案例检索设计的判别模型,通过将上下文化嵌入与关键事实靠近并远离非关键事实,提升了学习表示的区分能力。实验证明,我们的方法在公开可用的法律基准测试中胜过现有最先进方法,并为深入理解和处理法律案例文件提供了新视角。
Mar, 2024
提出了一种基于交互式多视图对比学习目标的法律案例检索网络,其中对比学习的视图包括案例视图和元素视图,以最小化由预训练语言模型编码器生成的相关法律案例表示之间的隐藏空间距离,并通过改变案例的法律元素来建立正负实例以帮助网络更好地计算法律相关性,实验证明其在相关案例检索基准上获得了显着的改进。
Oct, 2022
本研究提出了 CaseEncoder,一种利用法律领域细粒度知识进行预训练的法律文件编码器,它通过优化训练数据质量和设计法律特定的预训练任务,在零样例的情况下显著优于现有的通用预训练模型和法律专用的预训练模型。
采用编码总结、文档表示模型、词汇特征提取等方法,结合资源进行比较及潜在特征提取,实现针对法律信息提取 / 推理比赛的最优成果。
Sep, 2020
本文介绍了一种基于 Longformer 的预训练语言模型,名为 Lawformer,用于理解中国法律长文档。作者在判决预测、相似案例检索、法律阅读理解和法律问答等多个 LegalAI 任务上评估了模型性能,并表明该模型可以有效应用于处理长文档型法律任务。
May, 2021
利用大型语言模型进行相关判决的准确性研究,提出了一种适用于法律案例相关判决的新型工作流程,并通过与人工专家判断的比较,证明了该工作流程可以获得可靠的相关判决,并通过大型语言模型生成的数据综合增强现有的法律案例检索模型的能力。
我们提出了一种结构感知的检索增强语言模型,通过在预训练模型中检索并融合具有结构关系的科学文档,来改善检索到的内容的相关性、准确性和连贯性。
Nov, 2023
通过使用无监督的基于图形的排名模型,并使用重新加权算法来利用法律判决文件结构的特性,本研究研究了使用不同方法计算文档结构的影响,结果在加拿大法律案例实验数据集上表明了我们提出的方法优于多个强基线。
Nov, 2022