实现自动法国法律整合
通过数字技术,特别是 AI,在大规模的意大利项目 PRODIGIT 中,我们成功地生成法官决定的摘要,并提取了相关信息,如法律问题的识别和决策标准的提取。我们采用了不同的工具和方法进行提取和概括,其中包括了 GPT4 和 LLMs,得到了满意的结果。基于此,我们正在构建一个原型应用,将向公众提供。
Aug, 2023
本文介绍了一个名为 EUR-Lex-Sum 的新数据集,基于欧盟法律平台的法律法规摘要,包括 24 种官方欧洲语言的跨语言段落对齐数据,以及资源的关键特征对现有摘要资源进行比较。
Oct, 2022
法国政府推出了 LLaMandement,这是一种先进的大型语言模型,旨在提高处理立法会议的效率和效果(包括生成法案提案的中立摘要和部长级会议所需的文件),解决手动处理不断增长的法律修正案数量的行政挑战。LLaMandement 是法律技术里程碑的重要突破,提供了能够超越传统人工努力的可扩展性并与专门的法律起草人的强大性能相匹配的解决方案。我们向社区发布了所有经过优化的模型和训练数据。
Jan, 2024
本文介绍一种用于处理法律文档的语料库以及基于该语料库训练的模型,可自动预测法律文档中的修辞角色,进而提高摘要和法律判决预测的性能,并在本文中发布了此语料库和基线模型代码。
Jan, 2022
面向法律专业人员的,将自动摘要技术应用于长篇法律文书以便满足用户多样化信息需求的研究,引入了一种来自欧洲人权法庭司法管辖区域的面向方面的法律案例决策摘要的新数据集(LexAbSumm),并且通过评估针对长篇文档进行调整的多种生成性摘要建模方法揭示了这些模型在生成方面特定摘要上的挑战,以促进法律领域方面的摘要研究。
Mar, 2024
这篇论文介绍了欧洲创新项目 Lynx 中正在开发的一个系统的技术组件,包括工作流程管理器,基于自然语言处理和内容管理服务的工作流程的灵活编排,以及包含语义信息和有意义的法律文件参考的多语言法律知识图。论文还描述了不同的使用案例以及我们正在实验和开发的原型解决方案。
Mar, 2020
我们的研究致力于通过开发语言模型来为合同和政策文件提供自动化、易于理解的摘要和分数,以增强用户理解,促进知情决策。我们在数据集上比较了基于 Transformer 和传统模型,RoBERTa 整体表现更好,达到了 0.74 的 F1 分数。利用我们表现最佳的模型 RoBERTa,我们通过识别 GDPR 文件的重叠部分突出了冗余和潜在的指导方针违规情况,强调了对更严格 GDPR 合规性的必要性。
Apr, 2024
本研究提出了一种名为 LeSICiN 的模型,将法律引文网络和文本内容结合起来,成功地实现了对印度刑事法典(IPC)案例中存在的法律法规进行识别。通过对包含多个印度法院案件的案例事实和 IPC 法规的数据集进行实验,证实了该模型在法律条款识别任务上表现优越。
Dec, 2021
本文以 Universal Dependencies 项目为例,通过开发一种自动化框架实现从原始文本中提取语法规范,并聚焦于提取描述协议的规则。我们使用跨语言转移的方法,即使在语言专家的注释不可获得的情况下,也能提取出几乎等同于大量黄金标准注释数据所创建的语法规范。
Oct, 2020
该论文介绍了基于新兴概念的词典的开发,聚焦于非技术创新。它引入了一种结合了人类专业知识、统计分析和机器学习技术的四步方法,建立了一个可以普遍适用于多个领域的模型。该方法证明了其稳健性和相关性,突出了其对各种环境的适应性和对词汇研究的贡献。所开发的方法有望在概念领域中得到应用。
Jun, 2024