有限预算下快速学习的最佳臂识别

Feb, 2024

有限预算下快速学习的最佳臂识别

Best Arm Identification for Prompt Learning under a Limited Budget

Chengshuai Shi, Kun Yang, Jing Yang, Cong Shen

TL;DR在大型语言模型中，显著的指导遵循能力引发了对自动学习合适提示的日益关注。本研究通过在提示学习中显式引入有限预算约束，提出了一种统一的框架TRIPLE（用于提示学习的最佳臂识别），并通过利用聚类和函数逼近的思想对其进行了两种基于嵌入的增强。广泛的实验表明，TRIPLE在满足有限预算限制的同时，相对于之前的基线方法在多个任务上都取得了显著的性能提升。

Abstract

The remarkable instruction-following capability of large language models (LLMs) has sparked a growing interest in automatically learning suitable prompts. However, while many effective methods have been proposed, the cost incurred during the learning process (e.g., accessing LLM and ev

发现论文，激发创造

Co-Training改进大语言模型的基于Prompt的学习

本文研究发现，利用未标注的数据进行共同训练可以提高基于提示学习的性能，从而实现对具有挑战性数据集中性能的显著提高。

Feb, 2022

通过统一的评估和分析提高基于概率的提示选择

本文中，我们提出了一种统一的框架来解释和评估现有的概率基准选取方法，对13个常见的NLP任务进行了广泛的实验，并发现所有现有方法都可以统一为一些变量的方法，这些方法最大化了输入和相应模型输出之间的互信息，并提出了几种互信息的变体，并通过较新的校准方法，即Margin- Calibration by Marginalization（CBM）提高了最佳选择方法的准确性，从而将选中问题的性能与最佳Oracle问题的性能比率提高到99.44%。

May, 2023

PREFER: 通过反馈-反思-优化进行提示集成学习

通过反馈-反思-完善的PREFER方法，我们提出了一种简单、通用、自动的方法来改进大型语言模型的性能，通过无监督生成新的提示来解决现有方法中存在的问题，并通过前向和后向思考的新型提示集成方法提高性能评估的稳定性。

Aug, 2023

关于上下文学习中零样本提示设计的实际调查

该论文综述了大型语言模型在自然语言处理任务中的重要性，并聚焦于不同类型的提示（如离散、连续、少样本和零样本）及其对模型性能的影响。论文探讨了手动设计、优化算法和评估方法等多种提示设计方法，以优化模型在不同任务中的性能。此外，论文还讨论了评估提示性能所面临的挑战，并指出了提示设计在充分利用大型语言模型的潜力中的关键作用，为在自然语言处理任务中更有效、更高效地使用大型语言模型提供了启示。

Sep, 2023

PhaseEvo:面向大型语言模型的统一上下文提示优化

通过建立统一的上下文提示优化框架，本研究旨在实现上下文提示和示例的联合优化，并提出了一个高效的自动提示优化框架PhaseEvo，它结合了LLMs的生成能力和进化算法的全局搜索能力，通过创新的基于LLMs的变异操作提高搜索效率并加速收敛。实验证明，PhaseEvo在保持良好效率的同时大幅度优于最先进的基线方法。

Feb, 2024

大型语言模型的高效提示方法综述

在这篇论文中，我们对高效提示的各种方法进行了全面的概述，包括使用高效计算和高效设计进行提示的方法，重点关注未来的研究方向。

Apr, 2024

稳定PT：通过输入分离实现少样本学习的稳定提示

通过将硬提示和软提示作为单独的输入来解决prompt初始化带来的噪音问题，并通过对比学习优化软提示以利用类别感知信息，实验证明该方法在准确性上超过了先进方法7.20％，平均标准差减少了2.02，并在涵盖各种任务的7个数据集上得到了强大和稳定的结果。

Apr, 2024

有效排序感知的自动示例选择下的Prompt优化

通过利用预训练语言模型的隐藏嵌入来表示有序的示例集，并使用神经赌博算法来优化示例集，同时考虑示例的排序，我们提出了一种名为EASE的新方法，可以有效地找到一个有序的示例集，从而消除了测试时间计算以容纳所有测试查询，此外，EASE可以轻松扩展以同时优化示例和指令，通过广泛的实证评估，我们展示了EASE在现有方法上的优势，并揭示了示例选择对于上下文学习的影响，这可能是独立利益的实际见解。

May, 2024

加速语言模型评估

利用低秩分解的多臂赌博算法，我们的方法能够在仅使用通常所需资源的5-15％情况下，显著降低资源消耗，并且能够识别出性能最好的方法，从而降低成本85-95％。

Jul, 2024

从对比提示中学习：自动化优化和适应

本研究旨在解决当前提示优化方法仅依赖于错误样本学习的问题，以及有效提示在不同模型和语言中表现不佳的挑战。我们提出的对比提示学习框架（LCP）通过分析优劣提示实例的模式，采用对比学习生成有效提示。在Big-Bench Hard数据集上的评估表明，LCP在提示优化中胜率超过76%，且在不同模型版本、家族和语言中表现出强适应性。

Sep, 2024