基于知识增强语言模型的施工合同风险识别
本研究提出了一种新的自然语言推理应用 —— 针对合同的 “文档级自然语言推理”,解决了合同审查过于耗时和过于昂贵的问题,并标注并发布了目前最大的包括 607 个合同的语料库。研究还指出,以往的模型在该任务上表现不佳,而研究者引入了一种新的算法,并通过多标签分类和更复杂的上下文分割方法使该任务取得了显著进展,并认为这一领域还有很大的改进空间。
Oct, 2021
这篇论文通过比较大型语言模型与传统的法律合同审核人员、初级律师和法律流程外包商之间的差异,探讨了 LLMs 是否能在合同审核中在准确性、速度和成本效益方面超越人类。我们的实证分析将 LLMs 与由高级律师设定的标准相比较,发现这些先进的模型在确定法律问题方面与人类准确率相匹配甚至超过。在速度方面,LLMs 仅需几秒完成审核,而人类同行则需要数小时。在成本方面,LLMs 以极低一部分的价格运行,使传统方法的成本大幅降低了 99.97%。这些结果不仅仅是统计数据,它们预示着法律实践的巨变。LLMs 有望颠覆法律行业,提高法律服务的可访问性和效率。我们的研究断言,LLM 在法律合同审核领域的主导地位已经到来,挑战着现状,并呼唤法律工作流程的重新构想。
Jan, 2024
高风险领域中的语言模型性能评估是一个重要问题,本研究对指导调优的语言模型进行深入分析,重点关注事实准确性和安全性,通过在法律和医学两个高风险领域的六个自然语言处理数据集上进行实验,发现目前语言模型存在的局限性,并强调了提高语言模型能力和改进领域特定指标的重要性,以及通过更人性化的方法来增强安全性和事实可靠性,研究结果对于适应高风险领域、履行社会义务并符合即将颁布的欧盟 AI 法案具有重要推动作用。
Nov, 2023
通过文献综述和第一手实验,本文研究了大型语言模型(LLMs)的潜力。尽管 LLMs 具有成本效益和高效性等优点,但也存在着诸如提示调优、偏见和主观性等挑战。该研究通过利用 LLMs 进行定性分析的实验提供了新的见解,强调了成功和限制。此外,本文还讨论了缓解挑战的策略,如优化提示技术和利用人类专业知识。我们的工作旨在将 LLMs 有机地融入人机交互数据工作,并积极促进其负责任的应用,以此回应关于 LLMs 在研究中负责任应用的持续对话。
Apr, 2024
本文通过详细的案例研究,探讨了在软件工程背景下,应用大型语言模型(LLMs)构建测试用例的方法。通过定性和定量分析,评估了 LLMs 对测试用例全面性、准确性和效率的影响,并讨论了模型可解释性、伦理考虑和适应不同软件环境的挑战。本研究的结果为软件测试领域中应用 LLMs 提供了实用性见解,旨在促进对 LLMs 在优化软件开发过程中作用的全面理解。
Dec, 2023
合同分析是一项重复且不可或缺的过程,为了避免业务风险和责任,需要识别和分类协议中的关键条款和段落。本研究提出了 LegalPro-BERT,一种预训练的大规模语言模型,经过法律分类校准后用于有效处理法律条款的分类任务,并通过与当前基准结果的比较证明其性能优于以往研究的基准。
Apr, 2024
本研究旨在评估 GPT 模型在建筑工业中的应用机会和挑战,通过批判性评论、专家讨论和案例研究验证,发现其在项目生命周期中存在机遇,但同时也存在挑战,为此我们开发了一个用例原型来优化建筑材料的选择,为语言模型在建筑工业中的研究提供了前景和建议。
May, 2023
通过在大量无标注的法律文件上进行微调,利用本地计算机上的预训练的大规模语言模型可以实现生成法律文件草案的任务,并同时保护信息隐私和提高信息安全性。
Jun, 2024