多样情境下的多次学习

Apr, 2024

Many-Shot In-Context Learning

Rishabh Agarwal, Avi Singh, Lei M. Zhang, Bernd Bohnet, Stephanie Chan...

TL;DR大型语言模型在少样本上下文学习方面表现出色，通过在推断时从上下文中提供的少量示例进行学习，无需任何权重更新。新的扩展上下文窗口使我们能够研究在上下文中使用数百或数千个示例进行学习的多样本学习方法。从少样本到多样本，我们观察到在各种生成性和判别性任务中取得了显著的性能提升。然而，多样本学习在可用的人类生成示例方面存在瓶颈。为了缓解这一限制，我们探索了两种新的设置：增强和无监督的多样本学习方法。增强多样本学习方法使用模型生成的思考链替代人类示例。无监督多样本学习方法则完全取消了提示信息中的理由，并仅通过领域特定问题对模型进行提示。我们发现，增强和无监督多样本学习方法在多样本学习中非常有效，特别是在复杂推理任务中。最后，我们证明与少样本学习不同，多样本学习可以有效地覆盖预训练偏差，并学习具有数值输入的高维函数。我们的分析还揭示了下一个标记预测损失作为下游上下文学习性能指标的局限性。

Abstract

large language models (LLMs) excel at few-shot in-context learning (ICL) -- learning from a few examples provided in context at inference, without any weight updates. Newly expanded context windows allow us to in

large language models few-shot in-context learning many-shot learning reinforced icl unsupervised icl

发现论文，激发创造

神经机器翻译模型可以学习成为少样本学习器

大型语言模型的新兴能力是利用少量示例来学习在新领域和任务中执行的能力，本文通过针对专门的培训目标进行微调展示了一个更小的模型可以被训练用于执行上下文学习，在神经机器翻译的领域适应任务上进行了示例。通过这种上下文学习的能力，模型可以利用相关的少量示例将其输出适应到该领域。我们将这种域自适应的质量与传统的监督技术以及基于 400 亿参数的大型语言模型的上下文学习进行了比较。我们的方法允许对多个领域进行高效的批处理推理，并在翻译质量和即时适应率方面优于现有技术基线，也就是在展示一次示例后重新生成特定术语的能力。

Sep, 2023

能否在长上下文中使用多样本情境学习来帮助 LLM 法官？更多观察，更好判断！

使用大型语言模型作为评判器评估大型语言模型的性能，可能引入潜在的偏见，并对评估结果的可靠性提出关切。为了缓解这个问题，我们提出和研究两种版本的多示例上下文提示（加强和无监督），以帮助 GPT-4o 作为评判器进行单答案打分。基于设计的提示，我们研究了增加上下文示例数量对评估的一致性和质量的影响。此外，我们首次揭示了 GPT-4o 作为评判器在两两比较中存在的符号偏差，并提出了一种简单而有效的方法来缓解它。实验结果显示，先进的长上下文语言模型，如 GPT-4o，在多示例情况下的表现优于零示例情况。同时，实验结果进一步验证了符号偏差缓解方法的有效性。

Jun, 2024

少样本能否在长上下文中使用？重复上下文生成演示

利用上下文回收机制生成少数示例，提高长上下文问答任务中的大型语言模型性能。

Jun, 2024

多标签文本分类的上下文学习

利用预训练的密集检索模型，我们在有限样本设置中的常见意图分类数据集上，以及特定情况下的细粒度情感分类中，优于微调性能。通过多个实验，我们分析了模型对于上下文示例和不同模型规模的利用情况，并展示了在不同领域中需要不同程度上下文示例的相似性、类名的语义内容和示例与标签之间的正确对应。

Sep, 2023

多模态基础模型中的多示例上下文学习

多模态基础模型在少样本上下文学习中具有较高的效果，通过扩展到多样本上下文学习，可以显著提高模型性能和数据效率。

May, 2024

ParaICL: 面向鲁棒的并行上下文学习

通过并行处理不同批次的样本，依据语义相似性在上下文学习中同时使用所有示范样本，并通过加权平均语义目标选择最合适的标记，从而提高 ICL 的有效性。

Mar, 2024

Self-ICL: 自生成示范的零样本上下文学习

本文提出了 Self-ICL，一种基于零 - shot 学习的简单框架，用于优化大型语言模型的内在能力，并创造了虚拟演示的概念以有效地进行 ICL。通过在 BIG-Bench Hard 上进行的评估，该方法能够显着提高模型的性能。

May, 2023

LLMs 是少量样本上下文中的低资源语言学习者

通过询问对齐方式的另一种选择，全面研究了一致性学习（ICL）及其跨语言变体（X-ICL）对于 25 种低资源和 7 种相对较高资源的语言的有效性，发现了标签对齐的不足，并提供了有价值的洞察力，强调了提升低资源语言的理解能力的重要性。

Mar, 2024

面向情境学习的信息丰富的少样本提示与最大信息增益

本文研究了大型语言模型 (Large Language Models, LLMs) 在上下文学习 (In-context Learning, ICL) 方面的能力和稳定性问题，并提出了通过量化数据示例的信息增益 (Information Gain, IG) 来选择具有最大信息增益的样本的方法，同时引入了模板偏差 (template bias) 的校准策略，实验证明该方法能够显著提升三种 LLMs 在六个分类任务上的性能。

Oct, 2023

从错误中的上下文原则学习

通过学习任务特定的 “原则”，在原有的少样本示例基础上，利用上模型在这些示例中产生的错误来帮助解决类似问题并避免常见错误，从而提高大量基准测试的性能。

Feb, 2024