THUIR@COLIEE 2023：更多参数和法律知识用于法律案件推理

May, 2023

THUIR@COLIEE 2023：更多参数和法律知识用于法律案件推理

THUIR@COLIEE 2023: More Parameters and Legal Knowledge for Legal Case Entailment

Haitao Li, Changyue Wang, Weihang Su, Yueyue Wu, Qingyao Ai...

TL;DRTHUIR 在 COLIEE 2023 Legal Case Entailment 任务中尝试了传统词汇匹配方法和不同规模的预训练语言模型，使用学习排序方法进一步提高性能，但学习排序在此任务上不够强大，实验结果表明更多参数和法律知识有助于实现，最终在 COLIEE 2023 中获得第三名。

Abstract

This paper describes the approach of the thuir team at the COLIEE 2023 Legal Case Entailment task. This task requires the participant to identify a specific paragraph from a given supporting case that entails the decision for the query case. We try traditional →

legal case entailment thuir team lexical matching methods pre-trained language models learning-to-rank methods

发现论文，激发创造

将结构知识纳入预训练语言模型，用于法律案例检索：THUIR@COLIEE 2023

本研究总结了 2023 年 COLIEE 中冠军团队 THUIR 的方法，其中使用结构感知的预训练语言模型来加强对法律案例的理解，借助启发式预处理和后处理方法减少不相关信息的影响，并利用学习排序的方法来合并具有不同维度的特征，实验证明了该方法的优越性。

May, 2023

基于词汇和语义模型级联的法律案例检索和蕴含

利用神经网络和传统检索模型，我们参加了 COLIEE-2022 律师案例比赛的任务 1 和任务 2，结果在所有团队中排名第五。实验结果表明，传统的检索模型 BM25 仍然优于神经网络模型。

Apr, 2022

COLIEE 2023 的 CAPTAIN：法律信息检索和蕴含任务的高效方法

该论文介绍了在 COLIEE 2023 竞赛中处理 Task 2、Task 3 和 Task 4 的策略，使用了先进的深度学习方法、基于领域特征观察的设计方法，以及严谨的工程实践和方法论，在这些任务中取得了优秀的成绩，并在 Task 2 和 Task 3 中获得了第一名，Task 4 中也有良好结果。源代码可在指定的 URL 获得。

Jan, 2024

法律文本分析的词汇 - 形态学建模

本文提出了一种基于语言模型和机器学习方法，结合多种词汇和形态特征，用于解决法律问题和提供正确答案的 Legal Information Extraction/Entailment 问题，且无需大量训练数据和专业知识即可与最先进的法律信息检索和问题回答方式相竞争，并在比赛中获得了显著成果。

Sep, 2016

利用预训练词组评分模型，采用词汇匹配和摘要方法构建法律案例检索系统

采用编码总结、文档表示模型、词汇特征提取等方法，结合资源进行比较及潜在特征提取，实现针对法律信息提取 / 推理比赛的最优成果。

Sep, 2020

SemEval 2023 任务 6：LegalEval - 理解法律文本

该论文探讨了 Legal NLP 领域的研究，分析了 SemEval 举办的 LegalEval 任务的三个子任务：语言角色标注，法律实体识别和法院判例预测，并总结了 26 个团队的研究成果。

Apr, 2023

COLIEE 2023 中的 NOWJ - 法律信息处理中的多任务和集成方法

该论文介绍了 NOWJ 团队参加 COLIEE 2023 比赛的方法，重点是提高法律信息处理技术并将其应用于现实法律情景中，团队使用最先进的机器学习模型及创新方法，研究了四个任务，虽然成果未达到最新颖水准但结果提供了有价值洞察，并为改进法律信息处理铺平了道路。

Jun, 2023

VLSP 2023 -- LTER：法律文本语义推理挑战概述

在这个快速发展的人工智能时代，特别是在语言处理方面，对于在法律领域应用人工智能的需求变得越来越关键。本篇论文介绍了法律领域越南语的首个基础研究：通过越南语言和语音处理研讨会进行法律文本蕴含识别。通过分析参与者的结果，讨论了法律领域中存在的关键语言方面的挑战与需求。

Mar, 2024

利用上下文化大语言模型理解法律文件

针对印度等人口密集的国家法律案件增长的问题，本论文提出了解决该问题的有效技术 ——SemEval-2023 任务 6：理解法律文本的系统，该系统利用 Legal-BERT-HSLN 模型和 Legal-LUKE 模型预测法律文件的修辞角色和识别法律实体，并表明模型优于基线模型，在领先的任务排行榜中取得显著成绩。

Mar, 2023

从法律判决中提取与查询相关的段落

针对从法律判决中提取相关段落的任务，本文构建了一个专门的数据集，并评估了当前检索模型的性能，同时还使用不同模型建立了微调基准。结果突显了微调和零 - shot 方法之间的显著差距，强调了处理法律领域中分布偏移的挑战。本文还探讨了各种参数高效微调方法，并在信息检索的背景下评估了它们的实用性，为不同预训练和模型架构选择参数高效微调方法提供了启示。

Mar, 2024