多语言和单语细调语言模型的解释忠实度比较

ACLMar, 2024

多语言和单语细调语言模型的解释忠实度比较

Comparing Explanation Faithfulness between Multilingual and Monolingual Fine-tuned Language Models

Zhixue Zhao, Nikolaos Aletras

TL;DR在实际的自然语言处理应用场景中，研究人员不仅希望提高预测性能，还寻求模型预测的准确解释。已有研究探讨了不同因素对解释的准确性的影响，但多语言和单语言模型之间解释的准确性差异尚未探索。通过对五种语言和五种常用特征归因方法进行广泛实验，我们发现多语言模型的解释准确性与单语言模型存在差异，并且发现多语言模型越大，特征归因方法相对于单语言模型的解释准确性越低。进一步的分析表明，这种差异可能由模型分词器之间的差异引起。

Abstract

In many real natural language processing application scenarios, practitioners not only aim to maximize predictive performance but also seek faithful explanations for the model predictions. Rationales and importan

natural language processing explanations feature attribution methods faithfulness multilingual models

发现论文，激发创造

自然语言推理中归因方法评估的多语言视角

本文提出了一种多语言方法，用于评估自然语言推理的归因方法在合理性和忠实度方面的表现，并通过单词对齐量化忠实度。认为效果最好的归因方法在合理性和忠实度方面不同，并用基于高亮的解释增强了 XNLI 数据集，提供了一个支持未来 exNLP 研究的多语言 NLI 数据集。

Apr, 2022

自然语言处理中的模型解释研究综述

本综述通过对忠实度的镜头，回顾了超过 110 种自然语言处理中的模型解释方法。我们考虑了忠实度的定义和评估，以及它对可解释性的重要性，并将现有方法分为五类。最后，我们总结了它们的共同优点和未解决的挑战，并反思了未来的研究方向。

Sep, 2022

大型语言模型作为忠实的解释器

介绍了一种提高大型语言模型的自然语言解释质量的生成解释框架 xLLM，该框架通过评估器和迭代优化过程来最大化生成解释的忠实度分数，实验证明 xLLM 可以显著提高生成解释的忠实度。

Feb, 2024

概率也很重要：大型语言模型中自由文本解释的忠实度的更为准确的评估指标

评估了 Llama2 系列的少样本提示 LLMs 生成的自由文本解释在三个 NLP 任务上的忠实性，并发现我们的度量考虑了 CT 遗漏的忠实性方面。

Apr, 2024

自然语言解释的忠实度测试

本文探讨评估自然语言解释（NLEs）忠实度的挑战性问题，提出了两个测试：第一个是插入导致反事实预测的原因的反事实输入编辑器，第二个是从生成的 NLEs 中说明的原因中重建输入并检查它们导致相同预测的频率。我们的测试可以评估新兴的 NLE 模型，是开发忠实 NLE 的基本工具。

May, 2023

基准测试忠实度：关于在视觉语言任务中实现准确的自然语言解释

本文探讨了目前逐渐普及应用的神经模型的透明度和可理解性的需求，提出了三种可信度测量方法，并在对不同模型架构的比较中使用 VQA-X 和 e-SNLI-VE 数据集进行了评估。

Apr, 2023

忠实性与可信度：大型语言模型解释的（不）可靠性

大型语言模型的自解释性及其在高风险决策中的忠诚度与可信度之间的矛盾。

Feb, 2024

大型语言模型能自我解释吗？

利用自洽性检查作为一种忠实度测量，将其应用于大型语言模型自我解释的三种类型，即反事实解释、重要性度量和删除。通过不同任务和模型，发现忠实度是任务和模型相关的，例如对于情感分类，Llama2 的反事实解释、Mistral 的重要性度量和 Falcon 40B 的删除是更加忠实的。最后，我们的发现在提示变体方面是稳健的。

Jan, 2024

朝着真实的多语言大型语言模型迈进：基准测试和对齐策略

在大型语言模型（LLMs）时代，构建能够为全球用户提供服务的多语言大型语言模型（MLLMs）具有重要意义。然而，现有研究很少关注 MLLMs 的真实性。同时，当代多语言对齐技术在平衡大量语言方面常常存在严重的真实性差距，特别是那些与英语差距较大的语言。在我们的工作中，我们构建了一个用于多语言场景下真实性评估的基准，并探索了跨语言对齐事实以增强 MLLMs 真实性的方法。此外，我们提出了面向事实感知的多语言选择协同（FaMSS），以优化大量语言和不同数据类型之间的数据分配。实验结果表明，我们的方法可以有效减少多语言表示差异并增强 LLMs 的多语言能力。

Jun, 2024

关于解释在域外环境中的实证研究

该论文探索了自然语言处理中有关如何在不同领域中提取精准的解释的方法，其中侧重于后续解释和固有的忠诚度模型，并且发现后续解释的忠诚度在许多情况下比在领域内更高，而在跨域设置中，选择后预测模型的预测性能与完整训练模型相当。

Feb, 2022