揭示欧洲议会全体会议的政治议程:一个主题分析
本研究使用基于两层非负矩阵分解(NMF)的新动态主题建模方法分析了欧洲议会(EP)大会的政治议程及议员的讲话反应,结果显示两层 NMF 是现有动态主题建模方法的有力替代,并可揭示不受现有方法捕捉的专业主题和相关词汇。政治议程在欧洲议会显著演变并受到外部事件的影响,而 MEP 对议程的贡献也受到投票行为和议会委员会结构的影响。
Jul, 2016
我们提出了一种基于自然语言处理(NLP)的方法,用于研究欧洲议会(EP)中利益集团(游说团体)在立法过程中的影响。通过收集和分析利益集团的立场文件和欧洲议会成员(MEPs)的演讲,我们能够发现 MEPs 与利益集团之间的可解释联系。我们的最佳方法在对比分析中获得了 0.77 的 AUC 得分,并且明显优于其他基准方法。此研究有助于提高民主机构内复杂决策过程的透明度。
Sep, 2023
本文通过先进的 NLP 方法,联合比较分析了保加利亚、捷克、法国、斯洛文尼亚、西班牙和英国等 6 个国家在 2017-2020 年间的议会和立法辩论记录,探讨并评估不同国家议员的观点、情感以及性别、政治取向的识别,发现分析对象之间存在许多差异和共性。
Jul, 2022
Instruction-finetuned Large Language Models display political leanings, influencing downstream task performance; auditing Llama Chat in the context of EU politics demonstrates its political knowledge and reasoning abilities, offering potential as data-driven conversational engines for political science research.
Mar, 2024
本研究利用组合式阅读器模型对具有不同事件的多篇文档进行分析,以捕获并利用政治实体对特定事件所持的内在议程,从而形成多个实体、问题或事件的有效表征,通过定量和定性分析表明该模型是有意义和有效的。
Dec, 2020
利用 LLM 的潜在知识,本文提出了一种分析个别国会代表意识形态立场的方法,通过使用经过微调的 BERT 分类器从代表的演讲中提取基于意见的句子,并将每个代表的平均 BERT 嵌入投影到一对参考种子上,这些参考种子是在特定话题上具有相对立观点的已知代表,或者使用 OpenAI 的 GPT-4 模型生成的句子。
May, 2024
本文旨在分析用户如何与英国议会辩论的视频数据进行互动,使用超过两年的 Google Analytics 数据分析用户的互动模式,通过对视频浏览矩阵运用 NMF 算法来识别不同类型的用户。
Jun, 2022
本文通过研究历史语料库中编码的历时分布语义模型,重点关注两种特定形式的偏见,即政治偏见(即反共主义)和种族主义偏见(即反犹太主义),分析德国议会会议记录的新语料库,以期发现历史偏见趋势。同时,还提出了一种新的基于术语共现和基于图形标签传播的偏差度量方法。通过研究结果表明,在不同的时间段内,德国政治中存在反犹太主义和反共产主义的偏见趋势,从而证明了使用从历史语料库产生的语义空间分析历史偏见趋势的可行性。
Aug, 2021
介绍一份包含 1989 年到 2020 年希腊议会文件中逾 1 百万场政治演讲及其元数据的数据集,为解决无资源语言(如希腊)的大规模、历时政治话语数据而构建,可供计算语言学和政治分析使用,如研究词语用法随时间、历史事件和政党变化而变化,以及使用算法来探测语义转移。
Oct, 2022
介绍了一个关于政治取向和权力地位识别的数据集,该数据集从 ParlaMint 中派生而来,ParlaMint 是 29 个国家和地区议会的一组可比较的国会演讲语料库。我们介绍了该数据集,解释了在创建过程中的一些选择原则,在数据集上提供了统计数据,并利用一个简单的分类器对政治取向在左右轴线上的预测结果以及权力地位识别的基线结果进行了介绍,即区分执政联盟党派成员和反对党派成员发表的演讲。
May, 2024