LaCour!: 在欧洲人权法院的听证会上研究辩论技巧
该研究探讨了法律文本中的论点自动提取与语义分析方法,采用基于欧洲人权法院纪录的一种新的注释方案,提出了一种改进的模型,能够更加准确地对法律审判过程中的论点进行自动化提取与分类。
Aug, 2022
本文介绍了为英国司法部门设计自动转录工具的部分研究成果,使用自然语言处理和语音识别技术以及词汇短语提取机制等方法改进了识别准确率和专门用于英国法庭的术语转录质量。
Nov, 2022
基于欧洲人权法院的判决,推出了一种先例检索(PCR)数据集,以帮助系统全面理解法律事实和原则。通过采用不同的文本检索方法和负采样策略,进一步研究了 PCR 任务的困难度,以及与时间相关的检索模型的性能衰减。此外,还评估了 Halsbury's 和 Goodhart's 在 ECtHR 司法界的不同观点对 PCR 任务的影响。
Mar, 2024
本研究采用机器学习技术,首次构建了基于口头辩论实际内容的司法决策预测模型,可进一步了解法官和代表之间辩论的核心,包括法官个人的提问风格、怀疑态度以及哪些问题最为关键。
Jun, 2023
介绍了剑桥法律语料库(CLC),这是一个用于法律人工智能研究的语料库。该语料库包括超过 25 万个来自英国的法庭判例,涵盖了从 16 世纪至 21 世纪的案件。该论文介绍了该语料库的第一个版本,并提供 638 个案例的案件结果注释,以作为使用 GPT-3、GPT-4 和 RoBERTa 模型进行案件结果提取的基准。该论文还包括了广泛的法律和伦理讨论,以解决这一材料可能具有的敏感性。因此,该语料库仅在特定限制下释放供研究目的使用。
Sep, 2023
针对从法律判决中提取相关段落的任务,本文构建了一个专门的数据集,并评估了当前检索模型的性能,同时还使用不同模型建立了微调基准。结果突显了微调和零 - shot 方法之间的显著差距,强调了处理法律领域中分布偏移的挑战。本文还探讨了各种参数高效微调方法,并在信息检索的背景下评估了它们的实用性,为不同预训练和模型架构选择参数高效微调方法提供了启示。
Mar, 2024
本文使用自然语言处理技术,比较了基于关键词和逻辑运算符的传统方法与基于 Claude 2 大型语言模型的创新方法,在英国法院裁决案例的大语料库中提取总结性判决案例。结果表明,大语言模型的加权 F1 得分为 0.94,而关键词法的得分仅为 0.78,说明大语言模型在捕捉法律语言中的细微差别方面更加有效。本文展示了先进自然语言处理技术在核心法律研究任务中的应用,并且阐明了这些技术如何填补系统性差距并提升法律信息的可获取性。同时,我们分享了提取的数据集度量,以支持进一步的总结性判决研究。
Mar, 2024
本文中,作者通过领域专家调整、采用对抗式训练以及解释性分析等手段,对司法判决预测系统的表层信号干扰问题进行了研究,在使用现有的基准数据集进行实验时,取得了比仅用于预测的基准模型更好的预测准确率。同时,作者贡献了一组专家注释结果。
Oct, 2022
该篇研究探讨了关于 NLP 中的可解释性或解释性是如何应用在法律文本中的,为了更好的满足用户的需求,我们提出了一种基于段落的理由提取的方法,并引入了一个新的数据集,对已有的规则进行了研究和探究。结果表明,该任务非常具有挑战性并需要深入研究。
Mar, 2021
本研究通过收集欧洲议会在 2008 年至 2012 年期间进行的演讲,创建了一个新型的包括 6 种欧洲语言互相翻译的语音和文本样本的多语种 SLT 语料库 Europarl-ST,并展示了一系列的语音识别、机器翻译和口语翻译实验。
Nov, 2019