基于知识增强语言模型的施工合同风险识别

Sep, 2023

基于知识增强语言模型的施工合同风险识别

Construction contract risk identification based on knowledge-augmented language model

Saika Wong, Chunmo Zheng, Xing Su, Yinqiu Tang

TL;DR该论文介绍了一种新方法，利用建筑合同领域知识来增强大型语言模型，以模拟由人类专家进行的合同审查过程，该方法在真实建筑合同上取得了良好的性能。

Abstract

contract review is an essential step in construction projects to prevent potential losses. However, the current methods for reviewing construction contracts lack effectiveness and reliability, leading to time-con

contract review construction projects construction contracts large language models construction contract risks

发现论文，激发创造

ContractNLI: 合同文件级别自然语言推理数据集

本研究提出了一种新的自然语言推理应用 —— 针对合同的 “文档级自然语言推理”，解决了合同审查过于耗时和过于昂贵的问题，并标注并发布了目前最大的包括 607 个合同的语料库。研究还指出，以往的模型在该任务上表现不佳，而研究者引入了一种新的算法，并通过多标签分类和更复杂的上下文分割方法使该任务取得了显著进展，并认为这一领域还有很大的改进空间。

Oct, 2021

利用大型语言模型从房地产交易中提取信息

运用大型语言模型及基于变压器的架构自动化提取房地产销售合同中的信息，以提高效率和准确性，并讨论相关挑战、技术和未来发展方向。

Apr, 2024

更好的呼叫 GPT：大型语言模型与律师的比较

这篇论文通过比较大型语言模型与传统的法律合同审核人员、初级律师和法律流程外包商之间的差异，探讨了 LLMs 是否能在合同审核中在准确性、速度和成本效益方面超越人类。我们的实证分析将 LLMs 与由高级律师设定的标准相比较，发现这些先进的模型在确定法律问题方面与人类准确率相匹配甚至超过。在速度方面，LLMs 仅需几秒完成审核，而人类同行则需要数小时。在成本方面，LLMs 以极低一部分的价格运行，使传统方法的成本大幅降低了 99.97%。这些结果不仅仅是统计数据，它们预示着法律实践的巨变。LLMs 有望颠覆法律行业，提高法律服务的可访问性和效率。我们的研究断言，LLM 在法律合同审核领域的主导地位已经到来，挑战着现状，并呼唤法律工作流程的重新构想。

Jan, 2024

在高风险领域评估大型语言模型

高风险领域中的语言模型性能评估是一个重要问题，本研究对指导调优的语言模型进行深入分析，重点关注事实准确性和安全性，通过在法律和医学两个高风险领域的六个自然语言处理数据集上进行实验，发现目前语言模型存在的局限性，并强调了提高语言模型能力和改进领域特定指标的重要性，以及通过更人性化的方法来增强安全性和事实可靠性，研究结果对于适应高风险领域、履行社会义务并符合即将颁布的欧盟 AI 法案具有重要推动作用。

Nov, 2023

由学徒到研究助理：大型语言模型推动研究

通过文献综述和第一手实验，本文研究了大型语言模型（LLMs）的潜力。尽管 LLMs 具有成本效益和高效性等优点，但也存在着诸如提示调优、偏见和主观性等挑战。该研究通过利用 LLMs 进行定性分析的实验提供了新的见解，强调了成功和限制。此外，本文还讨论了缓解挑战的策略，如优化提示技术和利用人类专业知识。我们的工作旨在将 LLMs 有机地融入人机交互数据工作，并积极促进其负责任的应用，以此回应关于 LLMs 在研究中负责任应用的持续对话。

Apr, 2024

使用大型语言模型构建测试用例的案例研究：揭示实践洞见与挑战

本文通过详细的案例研究，探讨了在软件工程背景下，应用大型语言模型（LLMs）构建测试用例的方法。通过定性和定量分析，评估了 LLMs 对测试用例全面性、准确性和效率的影响，并讨论了模型可解释性、伦理考虑和适应不同软件环境的挑战。本研究的结果为软件测试领域中应用 LLMs 提供了实用性见解，旨在促进对 LLMs 在优化软件开发过程中作用的全面理解。

Dec, 2023

LegalPro-BERT: 利用 BERT 大型语言模型进行法律条款分类的微调

合同分析是一项重复且不可或缺的过程，为了避免业务风险和责任，需要识别和分类协议中的关键条款和段落。本研究提出了 LegalPro-BERT，一种预训练的大规模语言模型，经过法律分类校准后用于有效处理法律条款的分类任务，并通过与当前基准结果的比较证明其性能优于以往研究的基准。

Apr, 2024

建筑行业中的 GPT 模型：机会、限制和用例验证

本研究旨在评估 GPT 模型在建筑工业中的应用机会和挑战，通过批判性评论、专家讨论和案例研究验证，发现其在项目生命周期中存在机遇，但同时也存在挑战，为此我们开发了一个用例原型来优化建筑材料的选择，为语言模型在建筑工业中的研究提供了前景和建议。

May, 2023

使用精调预训练的大型语言模型进行法律文件起草

通过在大量无标注的法律文件上进行微调，利用本地计算机上的预训练的大规模语言模型可以实现生成法律文件草案的任务，并同时保护信息隐私和提高信息安全性。

Jun, 2024

为消除合同歧义生成澄清问题

我们引入了一项新的法律 NLP 任务，通过生成澄清问题来识别合同中的歧义，从而帮助非法律相关的利益相关者获取引出需求所必需的细节。

Mar, 2024