实现自动法国法律整合

Jan, 2023

Towards an Automatic Consolidation of French Law

Georges-André Silber

TL;DR通过使用编译器的连续传递和一种新的专业的函数类型语言，我们正在开发 Legistix 工具来自动整合法国和欧洲法律，而不是手动创建文本的完整整合版本，从而自动生成程序来创建整合版本。

Abstract

We present preliminary results about legistix, a tool we are developing to automatically consolidate the French and european law.

legistix automatically consolidate french law european law functional type

发现论文，激发创造

LLM 技术在法律摘要中的应用：PRODIGIT 项目

通过数字技术，特别是 AI，在大规模的意大利项目 PRODIGIT 中，我们成功地生成法官决定的摘要，并提取了相关信息，如法律问题的识别和决策标准的提取。我们采用了不同的工具和方法进行提取和概括，其中包括了 GPT4 和 LLMs，得到了满意的结果。基于此，我们正在构建一个原型应用，将向公众提供。

Aug, 2023

EUR-Lex-Sum: 法律领域长文摘要的多语言和跨语言数据集

本文介绍了一个名为 EUR-Lex-Sum 的新数据集，基于欧盟法律平台的法律法规摘要，包括 24 种官方欧洲语言的跨语言段落对齐数据，以及资源的关键特征对现有摘要资源进行比较。

Oct, 2022

LLaMandement：用于法国立法提案摘要的大型语言模型

法国政府推出了 LLaMandement，这是一种先进的大型语言模型，旨在提高处理立法会议的效率和效果（包括生成法案提案的中立摘要和部长级会议所需的文件），解决手动处理不断增长的法律修正案数量的行政挑战。LLaMandement 是法律技术里程碑的重要突破，提供了能够超越传统人工努力的可扩展性并与专门的法律起草人的强大性能相匹配的解决方案。我们向社区发布了所有经过优化的模型和训练数据。

Jan, 2024

用于自动化结构化法律文件的语料库

本文介绍一种用于处理法律文档的语料库以及基于该语料库训练的模型，可自动预测法律文档中的修辞角色，进而提高摘要和法律判决预测的性能，并在本文中发布了此语料库和基线模型代码。

Jan, 2022

LexAbSumm: 法律判决的基于方面的摘要

面向法律专业人员的，将自动摘要技术应用于长篇法律文书以便满足用户多样化信息需求的研究，引入了一种来自欧洲人权法庭司法管辖区域的面向方面的法律案例决策摘要的新数据集（LexAbSumm），并且通过评估针对长篇文档进行调整的多种生成性摘要建模方法揭示了这些模型在生成方面特定摘要上的挑战，以促进法律领域方面的摘要研究。

Mar, 2024

法律领域自然语言处理服务的编排

这篇论文介绍了欧洲创新项目 Lynx 中正在开发的一个系统的技术组件，包括工作流程管理器，基于自然语言处理和内容管理服务的工作流程的灵活编排，以及包含语义信息和有意义的法律文件参考的多语言法律知识图。论文还描述了不同的使用案例以及我们正在实验和开发的原型解决方案。

Mar, 2020

揭开晦涩法律用语的面纱：自动化方法用于隐私政策和服务条款的摘要和重叠分析

我们的研究致力于通过开发语言模型来为合同和政策文件提供自动化、易于理解的摘要和分数，以增强用户理解，促进知情决策。我们在数据集上比较了基于 Transformer 和传统模型，RoBERTa 整体表现更好，达到了 0.74 的 F1 分数。利用我们表现最佳的模型 RoBERTa，我们通过识别 GDPR 文件的重叠部分突出了冗余和潜在的指导方针违规情况，强调了对更严格 GDPR 合规性的必要性。

Apr, 2024

LeSICiN：一种基于异构图的自动化印度法律文件法规识别方法

本研究提出了一种名为 LeSICiN 的模型，将法律引文网络和文本内容结合起来，成功地实现了对印度刑事法典（IPC）案例中存在的法律法规进行识别。通过对包含多个印度法院案件的案例事实和 IPC 法规的数据集进行实验，证实了该模型在法律条款识别任务上表现优越。

Dec, 2021

自动提取控制形态一致性的规则

本文以 Universal Dependencies 项目为例，通过开发一种自动化框架实现从原始文本中提取语法规范，并聚焦于提取描述协议的规则。我们使用跨语言转移的方法，即使在语言专家的注释不可获得的情况下，也能提取出几乎等同于大量黄金标准注释数据所创建的语法规范。

Oct, 2020

自动发展新兴概念的词汇表：方法论探索

该论文介绍了基于新兴概念的词典的开发，聚焦于非技术创新。它引入了一种结合了人类专业知识、统计分析和机器学习技术的四步方法，建立了一个可以普遍适用于多个领域的模型。该方法证明了其稳健性和相关性，突出了其对各种环境的适应性和对词汇研究的贡献。所开发的方法有望在概念领域中得到应用。

Jun, 2024