基于文本的理想点
本文介绍了两个计算模型,一个是有监督分类器,一个是无监督主题模型,以自动区分政界人士在社交媒体上发布的内容的话题,是政治传播和社交媒体研究的有效、廉价的计算工具。
Sep, 2019
本研究分析2020年美国大选期间,支持者在社交媒体上对候选人的仇恨和冒犯性言论,建立了针对这些言论的标注任务,并采用BERT基线分类器评测了该任务的性能,从而为针对仇恨语言的计算模型提供了一种新的公开资源。
Mar, 2021
该研究提出了一种利用Twitter时间轴内容分析的非监督态度检测框架(Tweets2Stance)来预测社交媒体用户态度的方法,并通过对六个政党在20个不同议题上的一致性进行分析,依据党派帐号的言论预测政治主张。结果表明,T2S能以最小MAE为1.13的准确度成功检测用户的态度。
Apr, 2022
研究发现,使用社交媒体平台的用户只需发表13篇与社会相关的帖子即可预测其政治取向,作者通过创新的半自动化方法来发现用户的政治倾向,并公开了波兰的POLiTweets数据集,以研究多党制的政治倾向和领域转移等问题。
Jun, 2022
本篇研究利用ChatGPT等大语言模型对美国116届参议员进行纵向比较和分析,并筛选出与其政治思想立场相关的因素,在政治科学等领域进一步开拓了利用大语言模型技术进行测量与收集社会科学数据的新途径。
Mar, 2023
采用自然语言处理技术中的大型变形器模型,对政党政治纲领进行相似度测量,并分析它们与专家调查、选民投票记录及候选人网络等指标的相关性,考虑了这种方法替代专家判断的前景。
Jun, 2023
通过综合调查和实证比较当前党派预测实践,本文提出了几种与或超过最先进方法相竞争的新方法,同时需要更少的计算资源,使从业者能够从多种数据类型中选择并获得强大性能。
Aug, 2023
我们使用GPT-4在连续空间中获得政治文本的位置估计,通过将英国政党纲领在经济、社会和移民政策维度上定位,以及将美国国会议员的推文在左右意识形态谱系上定位,我们开发并验证了一种新的方法。对于政党纲领,GPT-4产生的位置与专家的相关性为93%或更高,性能与众包位置估计相当或更好。对于个别推文,GPT-4获得的位置与众包位置估计的相关性达到91%。对于美国第117届国会的参议员,使用GPT-4获得的位置与基于点名表决的估计相关性为97%,与基于竞选资金的估计相关性为96%。同一党派内的相关性也很大,表明使用GPT-4产生的位置估计捕捉到了参议员之间的党内差异。总体而言,使用GPT-4进行意识形态伸缩是快速、经济高效且可靠的方法,这为专家评估和众包评估提供了可行的替代方案。
Nov, 2023
本文介绍了一种名为“语义缩放”的新方法,用于从文本中进行理想点估计。利用大规模语言模型根据表达的立场对文档进行分类,并提取类似调查的数据。然后使用项目反应理论对这些数据进行尺度化处理。语义缩放显著改进了现有的基于文本的尺度化方法,并允许研究人员明确定义他们所测量的意识形态维度。这是首个在调查工具之外提供此种灵活性的尺度化方法,为难以进行调查的人群开辟了新的研究途径。此外,它适用于不同长度的文档,并生成对大众和精英意识形态的有效估计。作者证明该方法能区分政策偏好和内外群体情感,并根据人类判断在公众中表现出更好的效果。在国会中,它重新捕捉到了第一维DW-NOMINATE,并在解决构建效度挑战方面具有更大的灵活性。
May, 2024
利用 LLM 的潜在知识,本文提出了一种分析个别国会代表意识形态立场的方法,通过使用经过微调的 BERT 分类器从代表的演讲中提取基于意见的句子,并将每个代表的平均 BERT 嵌入投影到一对参考种子上,这些参考种子是在特定话题上具有相对立观点的已知代表,或者使用 OpenAI 的 GPT-4 模型生成的句子。
May, 2024