InstructEval: 指令选择方法的系统评估

Jul, 2023

InstructEval: 指令选择方法的系统评估

InstructEval: Systematic Evaluation of Instruction Selection Methods

Anirudh Ajith, Chris Pan, Mengzhou Xia, Ameet Deshpande, Karthik Narasimhan

TL;DR通过实验和评估，我们发现手写的命令和简单的命令通常比自动命令诱导方法更适用于ICL，指出后者的缺乏泛化性。

Abstract

in-context learning (ICL) performs tasks by prompting a large language model (LLM) using an instruction and a small set of annotated examples called demonstrations. Recent work has shown that the precise details

发现论文，激发创造

指令归纳：从少量样本到自然语言任务描述

该研究论文证明使用in-context learning可让大型语言模型显式推断潜在任务，通过自然语言生成指令，InstructGPT 的表现达到了人类的65.7％，建议指令感应可能是一种学习范例。

May, 2022

上下文指导学习

本文发现采用上下文学习作为指示学习方法（ICIL）可提高预训练和指示微调模型的零样本任务泛化能力，使用固定的单一提示来评估所有任务。

Feb, 2023

INSTRUCTEVAL：面向指导调整的大语言模型的全面评估

INSTRUCTEVAL是一个全面的评估套件，旨在评估大型语言模型在指令调整下的表现，其结果表明，指令数据的质量是影响模型性能的最重要因素，并且从问题解决能力和与人类价值观的一致性方面，这些模型还有很大的提升空间。

Jun, 2023

探索上下文学习与指导调整之间的关系

In this work, the relationship between In-Context Learning (ICL) and Instruction Tuning (IT) is explored by examining how the hidden states of Large Language Models (LLMs) change in these two paradigms, finding that ICL is implicit IT and the convergence is contingent upon factors related to the provided demonstrations.

Nov, 2023

再探在上下文学习中的示范选择策略

大型语言模型通过上下文学习（ICL）展示出了在各种任务中都具备惊人的能力，本研究探讨了影响ICL性能的因素，并提出了一种基于数据和模型的演示选择方法，该方法通过性能与模型对测试样本的理解相关联来进行演示选择，从而在语言理解和生成任务中实现了一致的改进。

Jan, 2024

优化上下文示例：是否为NICE的？

大型语言模型通过上下文学习与优化可以在广泛的任务上取得显著效果，然而，该研究调查了当提供任务特定指令时，优化上下文示例的必要性，并发现对于某些任务，对上下文示例进行优化产生递减收益，为此引入了用于测量任务可学习性的度量方法，从而提供了一种启发式方法，帮助决定针对任何新任务是优化指令还是优化上下文示例。

Feb, 2024

在LLM中，上下文学习是否足够用于指令遵循？

通过对长文本 LLMs 进行多个 in-context 学习示例的贪婪选择，我们改进了 ICL 与 URIAL 的对齐效果，但仍未消除与指令微调之间的差距，进一步的削减研究揭示了 ICL 在指令调整的环境中的特殊性，从而推进了对 ICL 作为对齐技术的理解。

May, 2024

优化和测试指令追踪：分析对指令化调整的语言模型的细粒度指令变种的影响

介绍了一种有效的数据增强技术，通过将复杂指令分解为简单的子组件、修改并重构它们为新的变体，以在训练和评估大型语言模型的指令追踪精度时保留原始指令的上下文和复杂性，并引入可变性。使用该方法开发了DeMoRecon数据集来精细调整和评估大型语言模型，在我们的指令追踪基准和常用基准上，发现使用DeMoRecon进行精细调整的大型语言模型性能显著提升。

Jun, 2024

ICLEval：评估大型语言模型的上下文学习能力

通过ICLEval基准测试，我们展示了不同大语言模型中ICL能力普遍存在，并且模型大小不是ICL功效的唯一决定因素。

Jun, 2024

教得更好或展示更聪明？关于自动提示优化中的指导和范例

使用自动提示优化方法，该研究综合比较了指令优化和示例选择技术在各种具有挑战性任务上的表现，发现智能地重用模型生成的输入输出对作为示例能够持续提高性能，并且选择示例的方法可能优于优化指令的方法。此外，示例选择和指令优化的最佳组合可以实现超过个别贡献的协同效应，并强调研究示例选择方法和其与指令优化的最佳结合在自动提示优化中的重要性。

Jun, 2024