计算语言学中的 XAI：理解斯洛文尼亚议会中的政治倾向

May, 2023

计算语言学中的 XAI：理解斯洛文尼亚议会中的政治倾向

XAI in Computational Linguistics: Understanding Political Leanings in the Slovenian Parliament

Bojan Evkoski, Senja Pollak

TL;DR本文的研究主要是关于使用机器学习预测政治倾向，并采用 Slovenian 议会的演讲记录，通过传统的机器学习和转换语言模型对左右倾向进行预测，并运用可解释性技术识别关键字短语来解释决策。

Abstract

The work covers the development and explainability of machine learning models for predicting political leanings through parliamentary transcripti

machine learning political leanings parliamentary transcriptions european migrant crisis explainability techniques

发现论文，激发创造

评估大型语言模型中的政治偏见

我们从德国的角度评估了当前最流行的开源模型在欧洲联盟内涉及政治问题的偏见，发现较大的模型更倾向于与左翼政党相符，而较小的模型通常保持中立，这凸显了 LLM 的细微行为和语言对其政治立场的重要性。我们的发现强调了对 LLMs 进行严格评估和处理社会偏见的重要性，以保障应用现代机器学习方法的应用程序的完整性和公平性。

May, 2024

诱导政治偏见使语言模型预测党派对争议的反应

通过使用大规模语言模型（LLMs）来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论，本研究创新性地采用了一个指导调整的 LLM，以反映一系列政治意识形态。我们提出了一个综合的分析框架，包括党派偏见差异评估和党派倾向预测，以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性，但在立场检测方面存在一些挑战，突显了 NLP 工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示 LLMs 中细致的政治理解的可行性和重要性，特别适用于需要敏锐意识到政治偏见的应用，为该领域做出了重要贡献。

Nov, 2023

利用 LLMs 研究欧洲政治光谱

Instruction-finetuned Large Language Models display political leanings, influencing downstream task performance; auditing Llama Chat in the context of EU politics demonstrates its political knowledge and reasoning abilities, offering potential as data-driven conversational engines for political science research.

Mar, 2024

议会中的多语言权力与意识形态识别：参考数据集与简单基线

介绍了一个关于政治取向和权力地位识别的数据集，该数据集从 ParlaMint 中派生而来，ParlaMint 是 29 个国家和地区议会的一组可比较的国会演讲语料库。我们介绍了该数据集，解释了在创建过程中的一些选择原则，在数据集上提供了统计数据，并利用一个简单的分类器对政治取向在左右轴线上的预测结果以及权力地位识别的基线结果进行了介绍，即区分执政联盟党派成员和反对党派成员发表的演讲。

May, 2024

多方面、多语言和跨语言议会演讲分析

本文通过先进的 NLP 方法，联合比较分析了保加利亚、捷克、法国、斯洛文尼亚、西班牙和英国等 6 个国家在 2017-2020 年间的议会和立法辩论记录，探讨并评估不同国家议员的观点、情感以及性别、政治取向的识别，发现分析对象之间存在许多差异和共性。

Jul, 2022

L (u) PIN: 基于 LLM 的政治意识形态实时预测

利用 LLM 的潜在知识，本文提出了一种分析个别国会代表意识形态立场的方法，通过使用经过微调的 BERT 分类器从代表的演讲中提取基于意见的句子，并将每个代表的平均 BERT 嵌入投影到一对参考种子上，这些参考种子是在特定话题上具有相对立观点的已知代表，或者使用 OpenAI 的 GPT-4 模型生成的句子。

May, 2024

使用语言模型理解政治极化：一个数据集与方法

通过使用语言模型分析美国政治体系中的政治极化，我们提供了对候选人立场的分析信息，以帮助选民了解其在经济、医疗保健、教育和其他社会问题上的观点，并进一步分析候选人的数据集和使用 “Longformer” 这样更强大的方式，找到每个候选人在其政治观点和背景上的最近邻。

Jan, 2023

大型语言模型的政治立场调查

利用定量框架和流程系统地调查大型语言模型的政治取向，研究结果显示在八个极化话题中，当用户查询涉及职业、种族或政治取向时，大型语言模型倾向于提供与自由派或左倾观点更为接近的回答，而不是保守派或右倾观点。为了避免这些模型提供政治化的回答，用户在构建查询时应谨慎，并选择中立的提示语言。

Mar, 2024

议会会议中的多语种情感识别训练数据集 ParlaSent

本文介绍一种基于情感分析的新数据集以及依此数据集进行的一系列实验，重点是训练一个强大的情感分类器用于议会会议。此外，还引入了第一个领域特定的 LLM（语言模型）用于政治科学应用，并在 27 个欧洲议会的会议记录中进行了 1.72 亿专业领域词汇的预训练。通过实验证明，LLM 在议会数据上的额外预训练可以显著提高模型的性能，尤其是在情感检测等具体领域任务上。同时，该研究显示多语言模型在未知语言上表现良好，并且来自其他语言的额外数据显著提高了目标议会的结果。本文对社会科学的多个领域做出了重要贡献，并将其与计算机科学和计算语言学相结合。最后，它建立了一种更可靠的政治文本情感分析方法，使学者能够使用标准化的工具和技术，从比较的视角研究政治情感。

Sep, 2023

无监督深度学习对社交媒体上政治倾向的精细预测

本文提出了一种新颖的无监督技术，可以从社交媒体文章的文本内容中学习微观的政治倾向，并在两项有挑战性的分类任务中实现了最佳结果。

Feb, 2022