PARAMANU-AYN: 适用于印度法律案件文件的高效新型生成和指导语言模型

Mar, 2024

PARAMANU-AYN: 适用于印度法律案件文件的高效新型生成和指导语言模型

PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents

Mitodru Niyogi, Arnab Bhattacharya

TL;DR本研究介绍了 PARAMANU-AYN，这是一种基于印度最高法院案件文件、印度宪法和印度刑法的语言模型。该模型使用了基于自回归解码器的新型预训练方法，通过训练和评估多个指令任务，证明了即使没有大量数据，也能从头开始开发一个专门的生成式法律语言模型。

Abstract

In this paper, we present paramanu-ayn, a language model based exclusively on case documents of the supreme court of india, the Constituti

发现论文，激发创造

HLDC: 印地語法律文件語料庫

本文介绍了一个Hindi Legal Documents Corpus (HLDC)的语料库，它包含了超过900K的清理和结构化的印地语法律文件。通过使用该语料库，我们引入了保释预测的任务，并使用了多任务学习（MTL）模型作为主要任务，用作概括任务的辅助任务。最后，我们释放了此论文的语料库和模型实现代码。

Apr, 2022

在印度法律文本上进行的预训练转换器

本文介绍了在印度法律文本上进行预训练的基于Transformer的PLMs，并在多个基准法律NLP任务上运用了这些PLMs，结果表明这些印度特定的PLMs非常有用。

Sep, 2022

LegalRelectra：用于长篇法律文本理解的混合领域语言建模

LegalRelectra 是一种基于 Electra 框架，使用 Reformer 生成器和鉴别器的法律领域语言模型，旨在处理包含多个领域词汇的文档，通过在混合法律和医学语料库上训练，其能够比通用领域和单领域医学和法律语言模型更好地处理混合领域（个人受伤）文本。

Dec, 2022

利用上下文化大语言模型理解法律文件

针对印度等人口密集的国家法律案件增长的问题，本论文提出了解决该问题的有效技术——SemEval-2023任务6：理解法律文本的系统，该系统利用Legal-BERT-HSLN模型和Legal-LUKE模型预测法律文件的修辞角色和识别法律实体，并表明模型优于基线模型，在领先的任务排行榜中取得显著成绩。

Mar, 2023

提高印度人民的司法准入：评估法律文本翻译成印度语言的基准

印度司法体系的大部分法律文本由于历史原因以复杂的英语编写而成，然而只有约10%的印度人能够阅读英语，因此需要将法律文本转化成各种印度语言，考虑到可用的英文法律文本的翻译。虽然对于印度语言之间的翻译已经有了很多研究，但据我们所知，在法律领域中对于这种翻译的先前工作并不多。在本研究中，我们构建了第一个高质量的法律平行语料库，其中包含了英语和九种印度语言的对齐文本单元，包括一些资源稀缺的语言。我们还对该语料库上的各种机器翻译系统进行了性能评估，其中包括商业机器翻译系统、开源机器翻译系统和大型语言模型。通过对法律从业人员的全面调查，我们了解了他们对其中一些机器翻译系统的满意度，并比较了自动机器翻译评估指标与法律从业人员意见之间的一致性。

Oct, 2023

建模法律推理：人类共识边缘的语言模型注释

使用生成式语言模型对复杂任务进行分类的能力有限，需要进行精细调优，而对法律推理的分类则表明人工注释密集的分类方法仍然具有重要意义。

Oct, 2023

大型语言模型的合法性及局限性：构建强大的法律语言模型的论证

近期自然语言处理（NLP）在法律领域的应用面临诸多挑战，包括极长的序列长度、专业词汇仅律师才能理解以及数据不平衡。大型语言模型（LLMs）的出现为NLP在法律领域提供了新的机会。本研究旨在量化普通LLMs与领域特定模型在法律领域的表现，通过比较三个通用LLMs（ChatGPT-20b，LLaMA-2-70b和Falcon-180b）在LexGLUE合同条款分类基准测试集上的零样本性能。尽管LLMs未经专门训练法律数据，但我们观察到它们在大多数情况下仍能正确分类主题。然而，我们发现它们的微F1/宏F1性能比在法律领域微调的较小模型要低19.2/26.8％，这凸显了需要更强大的法律领域LLMs。

Nov, 2023

大型语言模型与法律系统的探索：简要调查

人工智能和大型语言模型的进步正在给法律领域的自然语言处理任务带来深刻的转变。大型语言模型在法律部门展示出越来越多独特的优势和各种挑战。本调查研究了大型语言模型与法律系统之间的协同作用，例如在法律文本理解、案例检索和分析等任务中的应用。此外，该调查还突出了大型语言模型在法律领域面临的关键挑战，包括偏见、可解释性和道德考虑，以及研究人员如何解决这些问题。调查展示了针对不同法律体系量身定制的最新进展，以及用于各种语言的大型语言模型微调的法律数据集。此外，它提出了未来研究和发展的方向。

Apr, 2024

IL-TUR：印度法律文本理解与推理基准

这篇论文提出了IL-TUR：来自印度的法律文本理解和推理基准，它包含英语、印地语和九种印度语言的特定领域任务，旨在处理印度法律文件的不同方面，提供了基准模型和对模型与现实情况之间差距的描述，并创建了一个排行榜供研究界上传和比较法律文本理解系统。

Jul, 2024

大型语言模型在司法实体抽取中的比较研究

此研究探讨了大型语言模型在识别司法文件中的领域特定实体的应用，特别关注其处理领域特定语言复杂性和上下文变化的能力，并评估了包括Large Language Model Meta AI 3、Mistral和Gemma在内的最先进大型语言模型架构在提取适用于印度司法文本的司法事实方面的性能，其中Mistral和Gemma表现出优异的精确度和召回率，证实了大型语言模型在司法文件中的价值，展示了它们如何通过生成精确、有组织的数据输出来促进和加快科学研究，适合进行深入的研究。

Jul, 2024