Jun, 2024

Transformer 模型中的语言指纹:语言变体对讽刺检测参数选择的影响

TL;DR本研究探讨语言多样性、情感分析和变压器模型体系结构之间的相关性,旨在调查不同的英语变体对于基于变压器模型的讽刺检测的影响。我们使用 EPIC 语料库提取了五个不同的英语变体特定数据集,并在五个不同的体系结构上应用了 KEN 修剪算法,从而进行了研究。我们的结果揭示了最佳子网络之间的几个相似之处,这些相似之处提供了对共享强烈相似之处和表现出更大差异的语言变体的见解。我们发现,跨模型的最佳子网络至少共享 60% 的参数,强调了参数值在捕捉和解释语言变化方面的重要性。本研究突显了在不同语言变体上训练的模型之间固有的结构相似性,并强调了参数值在捕捉这些细微差别中的关键作用。