THUIR@COLIEE 2023:更多参数和法律知识用于法律案件推理
本研究总结了 2023 年 COLIEE 中冠军团队 THUIR 的方法,其中使用结构感知的预训练语言模型来加强对法律案例的理解,借助启发式预处理和后处理方法减少不相关信息的影响,并利用学习排序的方法来合并具有不同维度的特征,实验证明了该方法的优越性。
May, 2023
利用神经网络和传统检索模型,我们参加了 COLIEE-2022 律师案例比赛的任务 1 和任务 2,结果在所有团队中排名第五。实验结果表明,传统的检索模型 BM25 仍然优于神经网络模型。
Apr, 2022
该论文介绍了在 COLIEE 2023 竞赛中处理 Task 2、Task 3 和 Task 4 的策略,使用了先进的深度学习方法、基于领域特征观察的设计方法,以及严谨的工程实践和方法论,在这些任务中取得了优秀的成绩,并在 Task 2 和 Task 3 中获得了第一名,Task 4 中也有良好结果。源代码可在指定的 URL 获得。
Jan, 2024
本文提出了一种基于语言模型和机器学习方法,结合多种词汇和形态特征,用于解决法律问题和提供正确答案的 Legal Information Extraction/Entailment 问题,且无需大量训练数据和专业知识即可与最先进的法律信息检索和问题回答方式相竞争,并在比赛中获得了显著成果。
Sep, 2016
采用编码总结、文档表示模型、词汇特征提取等方法,结合资源进行比较及潜在特征提取,实现针对法律信息提取 / 推理比赛的最优成果。
Sep, 2020
该论文探讨了 Legal NLP 领域的研究,分析了 SemEval 举办的 LegalEval 任务的三个子任务:语言角色标注,法律实体识别和法院判例预测,并总结了 26 个团队的研究成果。
Apr, 2023
该论文介绍了 NOWJ 团队参加 COLIEE 2023 比赛的方法,重点是提高法律信息处理技术并将其应用于现实法律情景中, 团队使用最先进的机器学习模型及创新方法,研究了四个任务,虽然成果未达到最新颖水准但结果提供了有价值洞察,并为改进法律信息处理铺平了道路。
Jun, 2023
在这个快速发展的人工智能时代,特别是在语言处理方面,对于在法律领域应用人工智能的需求变得越来越关键。本篇论文介绍了法律领域越南语的首个基础研究:通过越南语言和语音处理研讨会进行法律文本蕴含识别。通过分析参与者的结果,讨论了法律领域中存在的关键语言方面的挑战与需求。
Mar, 2024
针对印度等人口密集的国家法律案件增长的问题,本论文提出了解决该问题的有效技术 ——SemEval-2023 任务 6:理解法律文本的系统,该系统利用 Legal-BERT-HSLN 模型和 Legal-LUKE 模型预测法律文件的修辞角色和识别法律实体,并表明模型优于基线模型,在领先的任务排行榜中取得显著成绩。
Mar, 2023
针对从法律判决中提取相关段落的任务,本文构建了一个专门的数据集,并评估了当前检索模型的性能,同时还使用不同模型建立了微调基准。结果突显了微调和零 - shot 方法之间的显著差距,强调了处理法律领域中分布偏移的挑战。本文还探讨了各种参数高效微调方法,并在信息检索的背景下评估了它们的实用性,为不同预训练和模型架构选择参数高效微调方法提供了启示。
Mar, 2024