通过统一的评估和分析提高基于概率的提示选择

May, 2023

通过统一的评估和分析提高基于概率的提示选择

Improving Probability-based Prompt Selection Through Unified Evaluation and Analysis

Sohee Yang, Jonghyeon Kim, Joel Jang, Seonghyeon Ye, Hyunji Lee...

TL;DR本文中，我们提出了一种统一的框架来解释和评估现有的概率基准选取方法，对13个常见的NLP任务进行了广泛的实验，并发现所有现有方法都可以统一为一些变量的方法，这些方法最大化了输入和相应模型输出之间的互信息，并提出了几种互信息的变体，并通过较新的校准方法，即Margin- Calibration by Marginalization（CBM）提高了最佳选择方法的准确性，从而将选中问题的性能与最佳Oracle问题的性能比率提高到99.44%。

Abstract

large language models (LLMs) have demonstrated great capabilities in solving a wide range of tasks in a resource-efficient manner through prompting, which does not require task-specific training, but suffers from performance fluctuation when there are multiple prompt candidates. Previo

发现论文，激发创造

自然语言处理中提示方法的系统调查：预训练、提示和预测

该研究论文调查和组织了一种新兴的自然语言处理范式，这种范式被称为“基于提示的学习”，并在其中介绍了其基础知识和数学符号，以及其在预训练模型、提示和调整策略等方面的相关研究成果，该框架通过使用模板将输入x修改为具有一些未填充信息的文本字符串提示x'，并将语言模型用于填充未填充信息以获得最终字符串x，从而实现零样本学习和少样本学习。

Jul, 2021

使用自然语言，提示是否解决自然语言处理任务？

本文研究了三种Prompt（包括Human-designed，Schema以及Null prompt）在有监督/无监督场景下的有效性，最终发现Schema prompt可以提高训练效果，且随着数据规模的扩大，不同Prompt的表现越来越接近。

Mar, 2022

考虑平坦度的提示选择可提高准确性和样本效率

该论文介绍了一种用于衡量语言提示效用的新度量标准，它被称为prompt flatness。作者使用它与其他提示选择度量标准相结合，提出了一种改进的提示选择方法，并且在6个分类基准测试中平均提高了5%的准确性和10%的皮尔逊相关性。

May, 2023

预训练语言模型中的提示优化的贝叶斯方法

以贝叶斯优化为基础，研究离散提示的优化方法及其应用于分类任务中的性能表现。

Dec, 2023

多步任务中的智能提问优化: 融合人类反馈和偏好对齐

通过结合人类设计的反馈规则，采用基于遗传算法的大语言模型驱动的离散提示优化框架，实现了对多步任务中自动提示的改进，相比现有的方法，平均有27.7%和28.2%的改善效果。

Feb, 2024

大型语言模型的高效提示方法综述

在这篇论文中，我们对高效提示的各种方法进行了全面的概述，包括使用高效计算和高效设计进行提示的方法，重点关注未来的研究方向。

Apr, 2024

大型语言模型的自动提示选择

自动选择给定输入的最佳提示，克服手动设计有效提示的挑战，通过聚类训练数据、生成候选提示、生成输入-提示-输出数据集以训练评估器，并使用评估器在测试时选择最佳提示来实现兼顾通用性和特异性的方法。在零-shot问答数据集上显示出竞争性性能。

Apr, 2024

通过模拟优化选择语言模型提示

基于模拟优化，提出了一个两阶段框架以实现生成语言模型的提示选择，该框架能够在评估和选择阶段中构建代表提示的中等维度向量的得分模型，并证明了该框架中的顺序评估过程的一致性。数值实验证明了此框架的有效性，为实施提供了实际指导。

Apr, 2024

大型语言模型中不同自然语言处理任务的提示工程方法综述

通过总结44篇研究论文，本文讨论了大型语言模型在各个自然语言处理任务中的提示工程技术，包括39种不同的提示方法在29个不同的任务上的性能表现、使用的语言模型以及对特定数据集的可能最先进技术，并提供了任务分类图。

Jul, 2024

从对比提示中学习：自动化优化和适应

本研究旨在解决当前提示优化方法仅依赖于错误样本学习的问题，以及有效提示在不同模型和语言中表现不佳的挑战。我们提出的对比提示学习框架（LCP）通过分析优劣提示实例的模式，采用对比学习生成有效提示。在Big-Bench Hard数据集上的评估表明，LCP在提示优化中胜率超过76%，且在不同模型版本、家族和语言中表现出强适应性。

Sep, 2024