IL-TUR：印度法律文本理解与推理基准

Jul, 2024

IL-TUR：印度法律文本理解与推理基准

IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning

Abhinav Joshi, Shounak Paul, Akshat Sharma, Pawan Goyal, Saptarshi Ghosh...

TL;DR这篇论文提出了IL-TUR：来自印度的法律文本理解和推理基准，它包含英语、印地语和九种印度语言的特定领域任务，旨在处理印度法律文件的不同方面，提供了基准模型和对模型与现实情况之间差距的描述，并创建了一个排行榜供研究界上传和比较法律文本理解系统。

Abstract

Legal systems worldwide are inundated with exponential growth in cases and documents. There is an imminent need to develop nlp and ml techniques for automatically processing and understanding →

发现论文，激发创造

在印度法律文本上进行的预训练转换器

本文介绍了在印度法律文本上进行预训练的基于Transformer的PLMs，并在多个基准法律NLP任务上运用了这些PLMs，结果表明这些印度特定的PLMs非常有用。

Sep, 2022

利用上下文化大语言模型理解法律文件

针对印度等人口密集的国家法律案件增长的问题，本论文提出了解决该问题的有效技术——SemEval-2023任务6：理解法律文本的系统，该系统利用Legal-BERT-HSLN模型和Legal-LUKE模型预测法律文件的修辞角色和识别法律实体，并表明模型优于基线模型，在领先的任务排行榜中取得显著成绩。

Mar, 2023

SCALE：高级语言模型评估复杂度的扩展

该研究引入了一个基于瑞士法律系统的多维NLP基准测试，包括长文本处理、领域特定知识拥有、多语言理解、多任务等挑战，该基准测试可以用于测试和推广最先进的LLMs模型。

Jun, 2023

LegalBench：一个协作构建的基准测试，用于评估大型语言模型在法律推理方面的表现

介绍了LegalBench，对20个开源和商业的大型语言模型进行了实证评估，并展示了LegalBench所提供的研究探索类型。

Aug, 2023

LawBench：大型语言模型法律知识基准评估

大型语言模型在法律领域的能力评估中，提出了全面评估基准LawBench，并经过广泛测试发现GPT-4是在法律领域表现最好的模型，但还有很大提升空间。

Sep, 2023

提高印度人民的司法准入：评估法律文本翻译成印度语言的基准

印度司法体系的大部分法律文本由于历史原因以复杂的英语编写而成，然而只有约10%的印度人能够阅读英语，因此需要将法律文本转化成各种印度语言，考虑到可用的英文法律文本的翻译。虽然对于印度语言之间的翻译已经有了很多研究，但据我们所知，在法律领域中对于这种翻译的先前工作并不多。在本研究中，我们构建了第一个高质量的法律平行语料库，其中包含了英语和九种印度语言的对齐文本单元，包括一些资源稀缺的语言。我们还对该语料库上的各种机器翻译系统进行了性能评估，其中包括商业机器翻译系统、开源机器翻译系统和大型语言模型。通过对法律从业人员的全面调查，我们了解了他们对其中一些机器翻译系统的满意度，并比较了自动机器翻译评估指标与法律从业人员意见之间的一致性。

Oct, 2023

MILDSum：用于印度法律案例判决的多语言摘要的新型基准数据集

印度司法体系中，针对印度语言的法律文件进行自动摘要是一个重要的问题，本研究以英语为源语言，尝试将印度的法律文件进行跨语言的英汉自动摘要。研究使用了3122例高质量的印度法院的判决案件，并展示了在法律领域跨语言摘要研究的必要性。

Oct, 2023

PARAMANU-AYN: 适用于印度法律案件文件的高效新型生成和指导语言模型

本研究介绍了 PARAMANU-AYN，这是一种基于印度最高法院案件文件、印度宪法和印度刑法的语言模型。该模型使用了基于自回归解码器的新型预训练方法，通过训练和评估多个指令任务，证明了即使没有大量数据，也能从头开始开发一个专门的生成式法律语言模型。

Mar, 2024

大型语言模型与法律系统的探索：简要调查

人工智能和大型语言模型的进步正在给法律领域的自然语言处理任务带来深刻的转变。大型语言模型在法律部门展示出越来越多独特的优势和各种挑战。本调查研究了大型语言模型与法律系统之间的协同作用，例如在法律文本理解、案例检索和分析等任务中的应用。此外，该调查还突出了大型语言模型在法律领域面临的关键挑战，包括偏见、可解释性和道德考虑，以及研究人员如何解决这些问题。调查展示了针对不同法律体系量身定制的最新进展，以及用于各种语言的大型语言模型微调的法律数据集。此外，它提出了未来研究和发展的方向。

Apr, 2024

大型语言模型在司法实体抽取中的比较研究

此研究探讨了大型语言模型在识别司法文件中的领域特定实体的应用，特别关注其处理领域特定语言复杂性和上下文变化的能力，并评估了包括Large Language Model Meta AI 3、Mistral和Gemma在内的最先进大型语言模型架构在提取适用于印度司法文本的司法事实方面的性能，其中Mistral和Gemma表现出优异的精确度和召回率，证实了大型语言模型在司法文件中的价值，展示了它们如何通过生成精确、有组织的数据输出来促进和加快科学研究，适合进行深入的研究。

Jul, 2024