LLMs对于文本干扰的鲁棒性

Jul, 2024

Robustness of LLMs to Perturbations in Text

Ayush Singh, Navpreet Singh, Shubham Vatsal

TL;DR通过人工引入各种程度的噪音到多样的数据集中，系统评估了大型语言模型对原始文本的变异的鲁棒性。研究结果显示，与流行观点相反，生成型大型语言模型对于文本中的噪音干扰非常稳健，并在语法错误修正（GEC）和词汇语义变化（LSC）等常见错误的基准任务上取得了新的技术水平。

Abstract

Having a clean dataset has been the foundational assumption of most natural language processing (NLP) systems. However, properly written text is rarely found in real-world scenarios and hence, oftentimes invalida

发现论文，激发创造

评估神经语言模型对输入干扰的鲁棒性

我们研究了在现实世界中输入文本可能有噪音或不同于NLP系统训练数据分布的情景，通过各种类型的字符级和单词级扰动方法来模拟这种情况，发现语言模型对输入扰动非常敏感，即使引入了很小的变化，其性能也会下降，需要进一步改进模型并对扰动输入进行评估以更加真实地了解NLP系统的鲁棒性。

Aug, 2021

估算和提高语言模型的强健性的方法

通过研究大型语言模型的泛化能力问题以及多种提高其分布韧性的方法，本文提出了未来改进大型语言模型鲁棒性的研究方向。

Jun, 2022

关于LLMs的隐含风险评估：关于鲁棒性，一致性和可信度的实证研究

本研究使用自动化工作流程，对 ChatGPT、LLaMA 和 OPT 等主流 LLM 进行了数百万次查询，得出了 LLM 在稳健性、一致性和可信度方面存在的问题，提出了一种新的关联数据集索引来评估使用 LLM 进行学术评估的可行性。

May, 2023

大型语言模型对词级扰动真的具有强健性吗？

利用预训练的奖励模型作为诊断工具，我们提出了一种用于评估大规模语言模型的稳健性的新方法，称为奖励模型合理鲁棒性评估（TREvaL）。经过广泛的实证实验，我们发现TREvaL在评估大规模语言模型的稳健性方面提供了一种准确的方法，尤其是在面对更具挑战性的开放性问题时。此外，我们的结果表明，大规模语言模型经常表现出对词级扰动的脆弱性，而这种扰动在日常语言使用中很普遍。令人惊讶的是，我们发现随着进一步的微调（SFT和RLHF）进行，模型的鲁棒性往往会降低。

Sep, 2023

LLM的输入扰动问题重新审视：噪声槽填充任务的统一鲁棒性评估框架

使用大型语言模型来评估对话理解能力，在输入扰动场景下提高扰动稳健性表现。

Oct, 2023

机器翻译模型是否在不被察觉的情况下变得更加健壮了？

通过对多语种机器翻译模型和大型语言模型在噪声输入情境下的实验研究，我们发现这些模型相比以往模型对各种噪声更加稳健，尤其是在处理干净数据情况下表现相似的情况下。我们还展示了这种趋势在社交媒体翻译实验中同样存在，同时分析了源文本校正技术在减轻噪声影响方面的应用情况。综上所述，我们展示了对于多种类型噪声的稳健性有所增强。

Mar, 2024

探索LLMs作为有针对性的合成文本数据源，以最小化高置信度的错误分类

使用大型语言模型进行数据增强，减少高置信度错误分类，并与人类数据进行比较，以降低成本并保持同样的准确性。

Mar, 2024

大语言模型对嘈杂指令的弹性

通过人为嵌入ASR错误和语法错误等五种常见中断类型，我们的研究揭示了大型语言模型在处理包含错误的文本时表现的韧性，以及纠正噪音指令对其性能产生的显著影响。

Apr, 2024

LLM的卓越稳健性：推理阶段？

通过删除和交换相邻层，我们展示并研究了大型语言模型的显著健壮性，并发现删除和交换方法可以在不进行微调的情况下保留原始模型预测准确性的72-95％，而具有更多层的模型表现出更强的健壮性。基于逐层干预和进一步实验的结果，我们假设了跨8个不同模型的四个普遍推理阶段的存在，即去标记化，特征工程，预测集成和残余调整。第一个阶段将局部信息融合，将原始令牌表示提升为更高级别的上下文表示。接下来是任务和实体特定特征的迭代改进。然后，模型的后半部分开始时进行相位转变，由于专用模型组件，隐藏表示与词汇空间更加一致。最后，最后一层通过消除向预测添加噪音的过时特征来调整后续令牌分布。

Jun, 2024

NLPerturbator：研究代码LLMs对自然语言变化的稳健性

本文研究了大型语言模型在现实场景中自然语言描述的变化对于代码生成的影响，并提出了一个自动化框架NLPerturbator来对不同类别的描述进行扰动，发现扰动后的描述可以显著降低代码生成的性能。研究强调了提高大型语言模型对于现实场景中描述变化的鲁棒性的重要性，以及构建描述时的细致性。

Jun, 2024