Feb, 2024

LLM 学生的政治偏好

TL;DR大规模语言模型(LLMs)中嵌入的政治偏好的综合分析表明,当使用具有政治内涵的问题 / 陈述进行调查时,大多数对话型 LLMs 往往生成被大多数政治测试工具诊断为左倾观点的响应,这提供了关于政治偏好可能主要发生在 LLMs 的预训练后期、监督微调和 / 或强化学习(RL)训练阶段的有趣假设的初步证据。