INACIA: 巴西审计法院中大型语言模型的整合：机会与挑战

Jan, 2024

INACIA: 巴西审计法院中大型语言模型的整合：机会与挑战

INACIA: Integrating Large Language Models in Brazilian Audit Courts: Opportunities and Challenges

Jayr Pereira, Andre Assumpcao, Julio Trecenti, Luiz Airosa, Caio Lente...

TL;DRINACIA是一个整合大型语言模型（LLMs）到巴西联邦法院（TCU）操作框架中的革命性系统，通过自动化案件分析的各个阶段，提取相关信息、评估其合法性，并生成司法建议。通过一系列实验，论文展示了INACIA在处理复杂法律任务方面的潜力，并讨论了其未来的潜在增强和应用。

Abstract

This paper introduces inacia (Instru\c{c}\~ao Assistida com Intelig\^encia Artificial), a groundbreaking system designed to integrate large language models (LLMs) into the operational framework of →

发现论文，激发创造

浅析大型语言模型的法律问题

本文介绍了如何将大型语言模型 LLMS 应用于法律领域，对应用于法律任务的不同方法进行了讨论，并探讨了使用 LLMS 所引发的隐私、偏见等法律问题，提出了数据资源领域学习上下文中的一些潜在方向。希望为当前 LLMS 的法律应用现状提供概述，同时强调其集成的潜在益处和挑战。

Mar, 2023

大型语言模型作为税务律师：一个关于法律能力的案例研究

本篇论文探讨了大型语言模型（LLMs）在应用税法方面的能力，发现使用少量提示可以显着提高最先进的模型性能，但它们仍不能像专业的税务律师那样进行推理和判断。

Jun, 2023

ChatLaw: 带外部知识库集成的开源法律大语言模型

本文介绍了一个名为ChatLaw的开源法律大语言模型，它通过特定的数据集、关键词检索和自注意力机制来优化模型在法律领域的表现，解决了参考数据筛选过程中的模型幻觉问题，提升了其解决问题的能力。

Jun, 2023

大型语言模型的合法性及局限性：构建强大的法律语言模型的论证

近期自然语言处理（NLP）在法律领域的应用面临诸多挑战，包括极长的序列长度、专业词汇仅律师才能理解以及数据不平衡。大型语言模型（LLMs）的出现为NLP在法律领域提供了新的机会。本研究旨在量化普通LLMs与领域特定模型在法律领域的表现，通过比较三个通用LLMs（ChatGPT-20b，LLaMA-2-70b和Falcon-180b）在LexGLUE合同条款分类基准测试集上的零样本性能。尽管LLMs未经专门训练法律数据，但我们观察到它们在大多数情况下仍能正确分类主题。然而，我们发现它们的微F1/宏F1性能比在法律领域微调的较小模型要低19.2/26.8％，这凸显了需要更强大的法律领域LLMs。

Nov, 2023

法律中的大型语言模型：一项调查

人工智能对传统司法行业产生了重大影响。最近，随着AI生成内容的发展，人工智能和法律在图像识别、自动文本生成和交互式聊天等领域得到应用。然而，法律领域的大型语言模型的应用仍处于初级阶段。本文对法律领域的大型语言模型进行了全面调查，揭示了它们在司法系统中的应用。同时，我们还讨论了法律领域大型语言模型的实际实施，如为用户提供法律咨询和协助法官审理案件。此外，我们探讨了法律领域大型语言模型的局限性，包括数据、算法和司法实践。最后，我们总结了实际建议并提出了未来发展方向以解决这些挑战。

Nov, 2023

Juru：来自可靠来源的巴西合法大型语言模型

通过领域专门化和高质量数据预训练，我们研究了大语言模型的高计算成本问题，发现领域专门化可以降低预训练数据量，但会牺牲同一语言中其他知识领域的性能。这一研究有助于证明预训练数据的选择可以提升大语言模型的性能，从而降低研究成本。

Mar, 2024

大型语言模型与法律系统的探索：简要调查

人工智能和大型语言模型的进步正在给法律领域的自然语言处理任务带来深刻的转变。大型语言模型在法律部门展示出越来越多独特的优势和各种挑战。本调查研究了大型语言模型与法律系统之间的协同作用，例如在法律文本理解、案例检索和分析等任务中的应用。此外，该调查还突出了大型语言模型在法律领域面临的关键挑战，包括偏见、可解释性和道德考虑，以及研究人员如何解决这些问题。调查展示了针对不同法律体系量身定制的最新进展，以及用于各种语言的大型语言模型微调的法律数据集。此外，它提出了未来研究和发展的方向。

Apr, 2024

InternLM-Law：一个开源的中国法律大型语言模型

通过在中国法律领域构建超过100万个查询的数据集，并实现数据筛选和处理流程以确保其多样性和质量，我们介绍了InternLM-Law，这是一个专门为回答与中国法律相关的各种法律问题而量身定制的大型语言模型。我们的训练方法涉及一种新颖的两阶段过程：首先在法律特定和通用内容上对LLM进行微调，以使模型具备广泛知识，然后在高质量的法律数据上进行独家微调以增强结构化输出生成能力。InternLM-Law在LawBench上的平均表现最高，在20个子任务中有13个超过了包括GPT-4在内的最先进模型。我们公开提供InternLM-Law和我们的数据集，以促进将LLM应用于法律领域的未来研究。

Jun, 2024

通过大型语言模型优化法律领域的数值估计和操作效率

本研究旨在解决法律领域中律师在提供及时和准确客户信息时面临的挑战，尤其是在潜在监禁时长和财务影响方面。我们提出了一种新颖的方法，将基于大型语言模型的技术与特别设计的提示相结合，以提高法律人工智能应用中的精确度。实验结果表明，该方法有效地生成了法律领域的准确数值估计，为提高法律流程的效率与公平性提供了可能的解决方案。

Jul, 2024

LexEval：评估大型语言模型的综合中文法律基准

本研究针对现有大型语言模型在法律应用中的准确性、可靠性和公平性不足的问题，提出了一个新的中文法律评估基准LexEval。该基准不仅涵盖了23个任务和14,150个问题，还引入了一种新的法律认知能力分类法，全面评估LLMs，并探讨了其应用中的伦理问题。研究发现对中国法律系统的发展和LLM评估管道提供了重要的见解。

Sep, 2024