超越提示脆弱性：评估 LLMs 中政治世界观的可靠性和一致性

Feb, 2024

超越提示脆弱性：评估 LLMs 中政治世界观的可靠性和一致性

Beyond prompt brittleness: Evaluating the reliability and consistency of political worldviews in LLMs

Tanise Ceron, Neele Falk, Ana Barić, Dmitry Nikolaev, Sebastian Padó

TL;DR通过一系列的测试，我们评估了大型语言模型（LLMs）对政治表态的可靠性和一致性，结果表明 LLMs 的态度可靠性随参数数量的增加而增加，较大的模型整体上更偏向左翼政党，但在各项政策方案中存在差异。它们对环境保护、社会福利、法律和秩序表现出（左翼）积极的态度，但对外交政策、移民和经济没有一致的偏好。

Abstract

Due to the widespread use of large language models (LLMs) in ubiquitous systems, we need to understand whether they embed a specific worldview and what these views reflect. Recent studies report that, prompted wi

large language models specific worldview llms' stances on political statements voting-advice questionnaires reliability

发现论文，激发创造

LLM 学生的政治偏好

大规模语言模型（LLMs）中嵌入的政治偏好的综合分析表明，当使用具有政治内涵的问题 / 陈述进行调查时，大多数对话型 LLMs 往往生成被大多数政治测试工具诊断为左倾观点的响应，这提供了关于政治偏好可能主要发生在 LLMs 的预训练后期、监督微调和 / 或强化学习（RL）训练阶段的有趣假设的初步证据。

Feb, 2024

大型语言模型的政治立场调查

利用定量框架和流程系统地调查大型语言模型的政治取向，研究结果显示在八个极化话题中，当用户查询涉及职业、种族或政治取向时，大型语言模型倾向于提供与自由派或左倾观点更为接近的回答，而不是保守派或右倾观点。为了避免这些模型提供政治化的回答，用户在构建查询时应谨慎，并选择中立的提示语言。

Mar, 2024

评估大型语言模型中的政治偏见

我们从德国的角度评估了当前最流行的开源模型在欧洲联盟内涉及政治问题的偏见，发现较大的模型更倾向于与左翼政党相符，而较小的模型通常保持中立，这凸显了 LLM 的细微行为和语言对其政治立场的重要性。我们的发现强调了对 LLMs 进行严格评估和处理社会偏见的重要性，以保障应用现代机器学习方法的应用程序的完整性和公平性。

May, 2024

利用大型语言模型在零样本学习下估算政治家意识形态

本篇研究利用 ChatGPT 等大语言模型对美国 116 届参议员进行纵向比较和分析，并筛选出与其政治思想立场相关的因素，在政治科学等领域进一步开拓了利用大语言模型技术进行测量与收集社会科学数据的新途径。

Mar, 2023

诱导政治偏见使语言模型预测党派对争议的反应

通过使用大规模语言模型（LLMs）来准确解读和预测政治偏见在社交媒体平台上充斥的政治性讨论，本研究创新性地采用了一个指导调整的 LLM，以反映一系列政治意识形态。我们提出了一个综合的分析框架，包括党派偏见差异评估和党派倾向预测，以评估模型在立场、情绪和道德基础等方面与现实政治意识形态保持一致。研究发现模型在捕捉情绪和道德细微差别方面的有效性，但在立场检测方面存在一些挑战，突显了 NLP 工具在政治敏感环境中精细化和改进的复杂性和潜力。此研究通过展示 LLMs 中细致的政治理解的可行性和重要性，特别适用于需要敏锐意识到政治偏见的应用，为该领域做出了重要贡献。

Nov, 2023

CommunityLM: 从语言模型中探究党派世界观

利用社区语言模型，研究政治言论语言化的分歧，通过观察群体在社交媒体中的表达，详细分析不同派别的观点，并且发现了相对于其他方法更高的对比度。

Sep, 2022

利用 LLMs 研究欧洲政治光谱

Instruction-finetuned Large Language Models display political leanings, influencing downstream task performance; auditing Llama Chat in the context of EU politics demonstrates its political knowledge and reasoning abilities, offering potential as data-driven conversational engines for political science research.

Mar, 2024

大型语言模型对报纸政治取向的检测

报纸定位存在明显差异问题，需加强 LLM 评估，改进算法以填补该民主国家敏感问题的重大空白，并促进社区参与。

May, 2024

揭示大型语言模型中的细粒度值和观点

通过分析大量的语言模型响应，我们发现大量语言模型的回应以及它们的正当性存在偏见和不一致性，此外，通过对回应的分析还发现了在不同情境下产生相似正当性的模式。

Jun, 2024

大型语言模型是否具有变色龙特性？

大型语言模型（LLMs）是否具有其自己的世界观和个性倾向？对 LLM 模型回答主观问题的模拟进行了 100 多万次，将其回答与欧洲社会调查（ESS）的真实数据进行比较，结果表明问题引导对偏见和变异的影响是基本的，突出了主要的文化、年龄和性别偏见。文中还讨论了测量 LLMs 与调查数据差异的方法，如计算加权平均值和基于 Jaccard 相似性的一项新提出的测量。我们得出结论，在使用 LLMs 模拟个体决策或集体行为之前，分析问题引导的稳健性和变异性非常重要，因为它们的模拟能力充其量是近似的。

May, 2024