多语言法律判决预测的法律提示工程

Dec, 2022

多语言法律判决预测的法律提示工程

Legal Prompt Engineering for Multilingual Legal Judgement Prediction

Dietrich Trautmann, Alina Petrova, Frank Schilder

TL;DR本研究使用 Legal Prompt Engineering 作为辅助工具，对长篇法律文件进行识别和理解，以进行法律判决预测任务。在人权法庭和瑞士联邦最高法院的案例中，无需领域特定的数据和额外的计算成本，只使用通用语言模型。结果显示，零 - shot LPE 相比基准方法表现更好，表明通用 LLMs 可能具有向法律领域的跨领域能力。

Abstract

legal prompt engineering (LPE) or Legal Prompting is a process to guide and assist a large language model (LLM) with performing a natural legal language processing (NLLP) skill. Our goal is to use LPE with LLMs over long legal documents for the →

legal prompt engineering natural legal language processing legal judgement prediction zero-shot lpe general-purpose llms

发现论文，激发创造

基于通信理论的大型语言模型的促进工程方法

大型语言模型的兴起改变了自然语言处理领域从单任务导向到全面的端到端多任务学习范式，其中基于大型语言模型的提示方法引起了广泛关注，尤其是由于提示工程的技术优势以及不同提示方法揭示的自然语言处理原理。本研究旨在通过建立通信理论框架来评述现有的提示工程方法，深入了解其中在四个典型任务中的发展趋势，并为未来的提示工程方法指明有前途的研究方向。

Oct, 2023

大型语言模型是人类水平的提示工程师

使用语言模型作自然语言指导的条件，我们提出了自动提示工程师（APE），通过搜索竞选一组精心设计的自动生成的提示中的最佳提示来优化指令来解决 NLP 任务中的性能问题，并实现对模型的更好的指导和性能提升。在 24 个任务中，通过自动产生的新指令，我们的 APE 方法可使性能提高，并在 19 个任务中的性能甚至好于人类注释者生成的指令。通过大量定性和定量分析，我们证明了 APE 的有效性。

Nov, 2022

零轉化臨床自然語言處理中大型語言模型的提示策略實證評估

本文综合系统地对五个临床自然语言处理任务（临床意义消除、生物医学证据提取、共指消解、药物状态提取和药物属性提取）的提示工程进行了实验研究，评估了多种提示类型在三种先进的大型语言模型（GPT-3.5、BARD 和 LLAMA2）上的性能，并提出了对临床 NLP 领域提示工程的新见解和指南。

Sep, 2023

提示工程师的提示工程

通过构建元提示（meta-prompt）从而更有效地引导大型语言模型（LLMs）进行自动提示工程，进而优化其性能。

Nov, 2023

企业中的提示工程实践探索

通过分析 Prompt 编辑行为和变化类型，以更好地理解 Prompt 工程实践，我们发现与大型语言模型的交互主要通过提示进行，并且有效提示设计取决于用户的迭代过程和目标的实现。

Mar, 2024

加强法律文件检索：采用大型语言模型的多阶段方法

将提示技术作为检索系统中的最后阶段，通过 BM25 预排名和基于 BERT 的再排名的支持，最大限度地提高提示的潜力，从而显着提高了检索准确性。

Mar, 2024

大型语言模型中开发提示工程的潜力释放：综合回顾

该综述研究了快速建模在发挥大型语言模型的能力方面的关键作用，探讨了角色激励、单次指示、观点链、观点树等快速建模的基本原则和高级方法，并阐述了外部插件如何协助此任务并减少机器幻觉，强调了深入了解结构和代理角色在人工智能生成内容工具中的重要性，最后讨论了在教育和编程等领域中应用快速建模的实践和潜力。

Oct, 2023

通过声明式众包重新审视提示工程

大型语言模型（LLM）在理解和生成文本数据方面非常强大，但容易出错。本文提出了一种声明性提示工程方法，将 LLM 视为众包工作者，并借鉴了声明性众包文献的思想，包括多种提示策略、确保内部一致性和探索混合 LLM - 非 LLM 方法，使提示工程过程更加有原则。在排序、实体解析和插补方面的初步案例研究展示了我们方法的优势。

Aug, 2023

业务过程管理中的提示工程

使用 GPT-3 等自然语言处理模型在业务流程管理（BPM）领域中取得了成功，但需要 fine-tuning 以及大量适当的训练数据。为此，本文提出可以借助 prompt engineering 将这些语言模型能力引入 BPM 研究，并提出了相关潜力和挑战的研究议程。

Apr, 2023

医疗应用的思维工程范式：范围审查和更好实践的建议

医疗领域中探索提示工程的有效性：回顾近期 114 项应用提示工程于医学领域的研究，覆盖提示学习、提示调优和提示设计领域，结果发现提示设计是最普遍的方法，其中有 12 篇论文中三者的术语被交替使用。ChatGPT 是最常用的大型语言模型，有七篇论文使用它来处理敏感的临床数据，而 “Chain-of-Thought” 是最常见的提示工程技术。提示学习和提示调优的研究通常为评估基于提示的方法提供了基准，但 64% 的提示设计研究缺乏非提示相关的基准。我们提供了总结现有工作的表格和图表，并提出建议以指导未来的研究贡献。

May, 2024