展现操作方式：解释在细调语言模型中的作用

Feb, 2024

展现操作方式：解释在细调语言模型中的作用

Show Me How It's Done: The Role of Explanations in Fine-Tuning Language Models

Mohamad Ballout, Ulf Krumnack, Gunther Heidemann, Kai-Uwe Kuehnberger

TL;DR我们的研究证明了使用解释来进行微调以提高语言模型性能的显著效益。与提示相比，微调允许模型在训练阶段学习和更新参数。我们将微调应用于包含输出解释而非仅呈现答案的数据中的各种规模的语言模型。即使是具有 6000 万参数的较小语言模型也从该方法中获益良多。有趣的是，我们的结果表明详细解释对较小的模型比大模型更有益处，后者几乎从任何形式的解释中获得同样的优势，无论其长度是多少。此外，我们证明包含解释使模型能够解决无法在没有解释的情况下解决的任务。最后，我们认为尽管添加解释具有挑战性，但包含解释的样本不仅减少了训练所需的数据量，还促进了模型的更有效泛化。总之，我们的研究结果表明，使用解释进行微调显著增强了大型语言模型的性能。

Abstract

Our research demonstrates the significant benefits of using fine-tuning with explanations to enhance the →

fine-tuning explanations language models performance benefits

发现论文，激发创造

OPT-R：探索解释在精调和提示中对大型语言模型推理能力的作用

本文对大型语言模型（LLMs）的推理能力进行了全面调查，重点研究了 Open Pretrained Transformers（OPT）模型作为此类模型的代表。通过在精心筛选的推理语料库上微调三种不同大小的 OPT，我们评估了所有模型在来自 SUPER-NATURAL-INSTRUCTIONS 基准测试的 57 项跨领域任务上的性能。研究发现，在微调时将解释纳入 fewshot 范例对模型的性能没有显著影响，而在提示和微调过程中逐步加入解释会略微但一致地提高分类准确性。

May, 2023

语言模型能否从上下文中的解释中学习？

通过对 40 个具有挑战性的任务提出带有答案解释的问题及各种匹配控制解释，我们发现解释可以提高大型语言模型在具有挑战性的任务上的零次和少量样本的表现，并且仅大型模型有益处。

Apr, 2022

基于解释的微调使模型对虚假线索更加鲁棒

本文提出了基于解释的微调作为一种缓解大型语言模型依赖错误相关的新颖通用方法，并在人工构建的训练集上微调模型，使其更加强壮。与标准微调不同，我们不仅仅针对输入进行预测，还微调模型以生成支持其答案的自由文本解释。与标准微调相比，我们的方法在四个分类任务中使模型对伪线索具有明显更强的稳健性。此外，我们的方法同样适用于由模型生成的解释，暗示了其在更多数据集上的适用性。

May, 2023

大型语言模型的可解释性概述

对大型语言模型的解释技术进行分类和总结，并讨论了这些技术在训练范式、生成局部解释和全局解释方面的应用以及评估指标、调试模型和提高性能的挑战和机会。

Sep, 2023

模型何时能从解释中学习？理解解释数据的角色的正式框架

这篇论文研究了解释数据对于模型效能的影响，利用回收法证明了推理为主的文本输入任务中，解释数据可用作模型输入，且采用检索式的建模方法可以使合成任务的准确率达到 95%，而无解释数据的基线准确率低于 65%。

Feb, 2021

大语言模型的解释提升小推断者的性能

利用大型语言模型的自由文本解释来提高小型模型的推理能力，将有助于实现可解释的 AI，并可以在理解所做的预测的过程中生成高质量的解释。

Oct, 2022

利用大型语言模型为人类导师提供解释性反馈

研究表明，学习者参与制作解释以支持他们的推理过程，对学习有积极影响。本文介绍了两种方法，可供教师在在线课程中提供实时反馈，并介绍了采用大型语言模型促进的命名实体识别的增强方法的进展。

Jun, 2023

自动神经元解释的提示调整的重要性

通过研究大型语言模型的个别神经元，改进解释提示的方式可以显著提高神经元解释质量并大幅减少计算成本。

Oct, 2023

通过解释一致性微调实现一致的自然语言解释

大语言模型经常生成有说服力和流畅的解释，但与人类不同，它们在不同输入上生成的解释通常不一致。本文提出了一种解释一致性微调的方法，通过对经过精心构造的合理解释的合成数据进行微调，使得大语言模型在相关示例上生成更一致的自然语言解释。这种方法在各种领域的问答数据集上获得了 10.0% 的相对解释一致性改善，并且在 7 个未在微调过程中使用的外部数据集上实现了 4.5% 的相对泛化改进。

Jan, 2024

内在维度解释语言模型微调的有效性

本文通过分析基于内在维度的微调现象，提出利用内在维度获取经验和理论直觉来解释当前预训练语言模型微调过程中的现象，然后通过实验证明了常规预训练模型具有极低的内在维度。最后，作者依靠低维任务表示和基于压缩的泛化界限将内在维度与泛化界限连接起来提出其在预训练语言模型中的应用。

Dec, 2020