LexGPT 0.1:基于 Pile of Law 的预训练 GPT-J 模型
LawGPT 是第一个专门为中国法律应用设计的开源模型,通过在大规模中国法律文件上进行法律导向的预训练和法律指导下的精细调优,LawGPT 在下游法律任务的表现优于开源模型 LLaMA 7B。
Jun, 2024
本研究介绍了基于 GPT-3 的虚拟法律助理 LawGPT 1.0,可进行智能答疑、法律咨询和文书生成等工作,并获得了良好的在法律基准测试中的表现。
Feb, 2023
本文研究使用最新的生成式预训练转换器(GPT)模型分析各种类型法律文件中一到几句话长度的文本片段的语义注释能力,结果表明该模型能够在零样本学习中表现出色,可广泛应用于语义注释的法律文本处理流程中。
May, 2023
对 COLIEE 任务 4 数据集中 Heisei 18(2006 年)到 Reiwa 3(2021 年)的日本法律文本具体判断能力的 GPT-3.5(ChatGPT)和 GPT-4 模型的分析揭示了模型在处理法律文本具体性任务方面的优点、缺点和性能模式,为未来优化 GPT-based 模型并在法律信息提取和具体性应用中成功采用奠定了基础。
Sep, 2023
利用 COLIEE 任务 4 数据集,探索生成式预训练转换器(GPTs)在跨语言法律问答系统中的应用,通过对四种不同的英语和日语提示和数据进行基准测试,为多语言法律问答方案的开发提供有价值的洞察,以提高效率和准确性。
Mar, 2024
对 GPT-4 在生成有关立法术语方面的准确性、清晰性和相关性上的表现进行评估。与基准设置相比,采用法律信息检索模块提供以前案例中的语句作为模型的上下文可以获得更好的结果,从而可以自主检索相关案例,并将这些案例中有用的语句压缩成有用的法律解释。
Jun, 2023
应用大型语言模型在知识产权领域具有挑战性,本研究提出了一种低成本、标准化的过程来训练面向知识产权的语言模型,成功满足了该领域的需求,并证明了在知识产权领域中专门训练的模型的有效性。
Apr, 2024
大型语言模型可以提高对法律系统的访问,但是目前很少有关于它们在进行法律任务方面有效性的实证研究。本研究以涉及加密货币的证券案件为背景,研究了语言模型的法律推理和起草能力。我们使用真实案例的情节喂给 GPT-3.5,并评估其确定正确违规行为的能力。研究发现,GPT-3.5 的法律推理能力较弱,但在法律起草方面表现更好。虽然目前无法取代律师,但这些模型的起草能力可以通过降低法律服务成本,为更多人提供司法公正的机会。本研究是第一个系统研究大型语言模型在诉讼、证券法和加密货币相关不当行为中的法律起草和推理能力的研究。
Aug, 2023
公开可获得的最好的 LLM(如 GPT-4 和 PaLM 2)在律师或律师助理所需的基本文本处理方面表现不佳,我们引入了一个基准来量化这种不良表现,这对于目前的 LLMs 在法律实践中的可靠性提出了疑问。为这些任务进行微调使得一种旧的 LLM 在我们的测试集上接近完美的表现,并提高了与法律相关的任务的表现。这个鲜明的结果凸显了在 LLM 训练中需要更多的领域专业知识。
Nov, 2023