情绪刺激与提示设计的交会:一种自动提示图形范式
自回归大语言模型已经改变了自然语言处理领域的格局。基于预训练和提示范式的方法已经取代了常规的预训练和微调方法用于许多下游自然语言处理任务。本文讨论了已经在自回归大语言模型上使用的各种提示技术,提供了一个基于这个分类体系的简明调研,并且确定了自回归大语言模型中提示领域的一些未解决问题,可作为未来研究的方向。
Nov, 2023
自动选择给定输入的最佳提示,克服手动设计有效提示的挑战,通过聚类训练数据、生成候选提示、生成输入 - 提示 - 输出数据集以训练评估器,并使用评估器在测试时选择最佳提示来实现兼顾通用性和特异性的方法。在零 - shot 问答数据集上显示出竞争性性能。
Apr, 2024
大型语言模型的兴起改变了自然语言处理领域从单任务导向到全面的端到端多任务学习范式,其中基于大型语言模型的提示方法引起了广泛关注,尤其是由于提示工程的技术优势以及不同提示方法揭示的自然语言处理原理。本研究旨在通过建立通信理论框架来评述现有的提示工程方法,深入了解其中在四个典型任务中的发展趋势,并为未来的提示工程方法指明有前途的研究方向。
Oct, 2023
大型语言模型在各种下游任务中表现出显著性能,而引导工程在优化大型语言模型性能中起着关键作用。本文通过回顾 35 项代表性研究,突出设计提示的局限性,同时保持一个期待大型语言模型像人类思考的人类化假设。通过引导大型语言模型按照建立的人类逻辑思维,我们展示目标导向的提示形式显著提高了大型语言模型的性能。此外,我们引入了一个新的分类法,将目标导向的提示方法分为五个相互关联的阶段,并通过总结十个可适用任务来展示我们框架的广泛适用性。我们提出了四个未来方向,希望进一步强调和推动目标导向的提示工程。
Jan, 2024
我们研究了自动的长提示工程算法,证明了贪婪算法和遗传算法在搜索效率方面的优越性,并引入了两种利用搜索历史增强搜索算法效果的新技术。我们的研究结果表明,该算法在 Big Bench Hard 的八个任务中实现了平均 9.2% 的准确度提升,突显了自动化提示设计对充分利用 LLMs 的能力的重要性。
Nov, 2023
研究通过结合当前评估模型的优势与新建立的提示性大语言模型的范式,提出了一种新颖的框架,以实现对对话的鲁棒性和多语言性评估能力,并在多个基准测试中取得了最先进的成果,并在 DSTC11 轨道 4 “开放领域对话系统的自动评估指标” 中分别在鲁棒性和多语言任务中名列前茅,证明了提示性大语言模型的评估能力。
Aug, 2023
LLMs have demonstrated commendable performance across diverse domains, but formulating high-quality prompts to effectively instruct LLMs poses a challenge. Inspired by structured reusable programming languages, LangGPT is proposed as a dual-layer prompt design framework that significantly enhances the capacity of LLMs to produce superior responses and has proven effective in guiding LLMs to generate high-quality prompts.
Feb, 2024
使用语言模型作自然语言指导的条件,我们提出了自动提示工程师(APE),通过搜索竞选一组精心设计的自动生成的提示中的最佳提示来优化指令来解决 NLP 任务中的性能问题,并实现对模型的更好的指导和性能提升。在 24 个任务中,通过自动产生的新指令,我们的 APE 方法可使性能提高,并在 19 个任务中的性能甚至好于人类注释者生成的指令。通过大量定性和定量分析,我们证明了 APE 的有效性。
Nov, 2022