SAILER: 面向法律案例检索的结构感知预训练语言模型

SIGIRApr, 2023

SAILER: 面向法律案例检索的结构感知预训练语言模型

SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval

Haitao Li, Qingyao Ai, Jia Chen, Qian Dong, Yueyue Wu...

TL;DR本文提出 SAILER，一个基于结构感知的先训练语言模型，适用于法律案例检索，实验证明其能在公共数据集上显著优于现有方法。

Abstract

legal case retrieval, which aims to find relevant cases for a query case, plays a core role in the intelligent legal system. Despite the success that pre-training has achieved in ad-hoc retrieval tasks, effective

legal case retrieval pre-training language model sailer asymmetric encoder-decoder architecture

发现论文，激发创造

通过知识引导的案例重构学习可解释性法律案例检索

通过将专业的法律知识与大型语言模型相结合，KELLER 引入了一种基于大型语言模型的法律案例重构方法，用于实现有效和可解释的法律案例检索，并在两个法律案例检索基准上展示了 KELLER 相比现有方法在复杂法律案例查询方面的卓越性能和鲁棒性。

Jun, 2024

将结构知识纳入预训练语言模型，用于法律案例检索：THUIR@COLIEE 2023

本研究总结了 2023 年 COLIEE 中冠军团队 THUIR 的方法，其中使用结构感知的预训练语言模型来加强对法律案例的理解，借助启发式预处理和后处理方法减少不相关信息的影响，并利用学习排序的方法来合并具有不同维度的特征，实验证明了该方法的优越性。

May, 2023

DELTA: 通过结构化词语对齐，预先训练一个判别性编码器用于法律案件检索

在法律案例检索中，利用预训练语言模型的有效性已得到研究证明。然而，现有工作大多侧重于提高上下文嵌入的表示能力，并使用文本语义相似性计算相关性。本研究引入 DELTA，一种针对法律案例检索设计的判别模型，通过将上下文化嵌入与关键事实靠近并远离非关键事实，提升了学习表示的区分能力。实验证明，我们的方法在公开可用的法律基准测试中胜过现有最先进方法，并为深入理解和处理法律案例文件提供了新视角。

Mar, 2024

基于法律要素的多视角对比学习模型在法律案件检索中的应用

提出了一种基于交互式多视图对比学习目标的法律案例检索网络，其中对比学习的视图包括案例视图和元素视图，以最小化由预训练语言模型编码器生成的相关法律案例表示之间的隐藏空间距离，并通过改变案例的法律元素来建立正负实例以帮助网络更好地计算法律相关性，实验证明其在相关案例检索基准上获得了显着的改进。

Oct, 2022

CaseEncoder：一种知识增强的预训练模型，用于法律案例编码

本研究提出了 CaseEncoder，一种利用法律领域细粒度知识进行预训练的法律文件编码器，它通过优化训练数据质量和设计法律特定的预训练任务，在零样例的情况下显著优于现有的通用预训练模型和法律专用的预训练模型。

May, 2023

利用预训练词组评分模型，采用词汇匹配和摘要方法构建法律案例检索系统

采用编码总结、文档表示模型、词汇特征提取等方法，结合资源进行比较及潜在特征提取，实现针对法律信息提取 / 推理比赛的最优成果。

Sep, 2020

Lawformer: 面向中文法律长文本的预训练语言模型

本文介绍了一种基于 Longformer 的预训练语言模型，名为 Lawformer，用于理解中国法律长文档。作者在判决预测、相似案例检索、法律阅读理解和法律问答等多个 LegalAI 任务上评估了模型性能，并表明该模型可以有效应用于处理长文档型法律任务。

May, 2021

在法律案例检索中利用大型语言模型进行相关判断

利用大型语言模型进行相关判决的准确性研究，提出了一种适用于法律案例相关判决的新型工作流程，并通过与人工专家判断的比较，证明了该工作流程可以获得可靠的相关判决，并通过大型语言模型生成的数据综合增强现有的法律案例检索模型的能力。

Mar, 2024

ATLANTIC: 结构感知的检索增强语言模型用于跨学科科学

我们提出了一种结构感知的检索增强语言模型，通过在预训练模型中检索并融合具有结构关系的科学文档，来改善检索到的内容的相关性、准确性和连贯性。

Nov, 2023

利用文档结构优化无监督法律案例摘要提取

通过使用无监督的基于图形的排名模型，并使用重新加权算法来利用法律判决文件结构的特性，本研究研究了使用不同方法计算文档结构的影响，结果在加拿大法律案例实验数据集上表明了我们提出的方法优于多个强基线。

Nov, 2022