ACLMar, 2024

多语言和单语细调语言模型的解释忠实度比较

TL;DR在实际的自然语言处理应用场景中,研究人员不仅希望提高预测性能,还寻求模型预测的准确解释。已有研究探讨了不同因素对解释的准确性的影响,但多语言和单语言模型之间解释的准确性差异尚未探索。通过对五种语言和五种常用特征归因方法进行广泛实验,我们发现多语言模型的解释准确性与单语言模型存在差异,并且发现多语言模型越大,特征归因方法相对于单语言模型的解释准确性越低。进一步的分析表明,这种差异可能由模型分词器之间的差异引起。