计算社会学：利用大型语言模型预测COVID-19极化

May, 2024

计算社会学：利用大型语言模型预测COVID-19极化

In Silico Sociology: Forecasting COVID-19 Polarization with Large Language Models

Austin C. Kozlowski, Hyunku Kwon, James A. Evans

TL;DR通过在大规模文本存档上训练深度神经网络，大型语言模型能够学习构成历史和当代话语的复杂语言模式。我们认为，通过使特定社会和文化背景中的受访者能够进行准确模拟，LLMs可以成为社会学研究的有价值工具。应用LLMs，我们重建了2019年的公众舆论格局，以检查COVID-19未来极化在现有政治话语中是否预示。通过在2019年的文本上训练LLMs，我们模拟美国自由派和保守派对一系列与疫情相关的问题的回答。我们发现，在84%的情况下，模拟的回答者再现了观察到的党派间的COVID-19态度差异，显著高于偶然差异。我们发现，观察到的党派差距在很大程度上对应于对自由、安全和机构信任的不同诉求。我们的发现表明，COVID-19的政治化在很大程度上与先前的意识形态格局一致，这一前所未有的事件推动着历史沿着其轨道前进，而不是改变其方向。

Abstract

By training deep neural networks on massive archives of digitized text, large language models (LLMs) learn the complex linguistic patterns that constitute historic and contemporary discourses. We argue that LLMs can serve as a valuable tool for →

发现论文，激发创造

利用情感分析和深度学习进行跨文化极性和情感检测：以COVID-19为例的案例研究

本研究利用自然语言处理和深度学习技术，对推特帖子进行情感极性和情绪的分析，研究发现不同国家在 COVID-19 危机中的反应和情感是基于社会规范和政治意愿的体现，且不同文化之间的差异会导致国家在危机中的决策不尽相同。

Aug, 2020

利用社交媒体帖子的无监督嵌入聚类预测 COVID-19 病例负载

通过追踪特定美国州COVID-19子版块Reddit帖子的句子级表示的高密度聚类，我们将基于转换器的语言模型纳入了传染病建模中，并在许多高质量数据集中进行基准测试。结果表明，除了其他特征类型之外，这些聚类嵌入特征在预测传染病上升趋势信号方面表现最好，对于流行病学数据不可靠的领域具有重要意义。随后，在时间序列预测任务中，我们充分利用了以上模型的预测能力，并比较了使用不同补充数据集作为协变量特征集时，基于转换器的时间序列模型的相对优势。

May, 2022

Twitter对话预测每日COVID-19确诊病例

本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析，探究社交媒体对疫情预测的作用，结果表明加入社交媒体变量可以改进疫情预测模型的准确性，并发布全球的 MegaGeoCOV 数据集，以帮助更好地理解全球疫情的动态。

Jun, 2022

COVID-19期间的多维种族主义分类: 羞辱、冒犯、责备和排斥

本研究提出多维度的种族主义检测模型，结合 BERT 和主题建模等技术，分析了 COVID-19 期间数字平台上的种族主义动态，帮助精准预测并干预公众舆论演变中的反种族主义情绪，并提出了社交网络分析与挖掘等未来研究方向。

Aug, 2022

透过 Twitter 进行 COVID-19 主题建模的深度学习：Alpha、Delta 和 Omicron

本研究使用深度学习模型，利用印度Twitter数据集，对COVID-19疫情的第一至第三波进行话题建模，发现官方治理、疫苗接种和疫情管理等是话题重叠的主题，并发现 COVID-19 疫情的政治、社会和经济情况下出现了新问题。研究结果表明，不同时期的主要话题与相应时间段流行的新闻媒体有强烈的定性相关性。该研究还具有扩展到其他国家和地区捕捉COVID-19疫情不同阶段的主要问题的潜力。

Feb, 2023

COVID大流行期间德国推文的政策偏好变化

在线社交媒体成为交换政治观点的重要论坛之一。在COVID措施得到回应的情况下，公民们在这些平台上直接表达其政策偏好。然而，对在线社交媒体中的政治偏好进行量化仍然具有挑战性，因为海量的内容需要可伸缩的自动化政治偏好提取，而目前的机器学习技术在细粒度政治偏好提取方面存在困难，这是由于缺乏数据集。本文介绍了一个包含细粒度政治偏好注释的推文新数据集。在这个数据集上训练的文本分类模型被用来从2019年到2022年的德国Twitter语料库中提取政策偏好。我们的研究结果表明，在应对COVID流行病的过程中，政治观点的表达增加了。我们使用一个成熟的政策偏好分类体系来分析细粒度的政治观点，同时突出显示不同政治类别中的变化。这些分析表明，政策偏好表达的增加主要集中在亲福利、亲教育和亲政府行政效率等类别。我们在本研究中使用的所有训练数据和代码都已公开发布，以鼓励其他研究人员进一步改进自动化政策偏好提取方法。我们希望我们的发现有助于更好地理解在线社交媒体中的政治陈述，并能更好地评估COVID措施对政治偏好的影响。

Jul, 2023

基于混合深度学习框架自动发现COVID-19推特中的话题和情感

提取了 COVID-19 推文的关键主题和情感，使用深度学习模型实现了更好的主题标签提取和情感分析，以及最高的准确率。

Dec, 2023

利用大型语言模型推进实时流行病预测：COVID-19 案例研究

我们提出了PandemicLLM，这是一个新颖的框架，利用多模态大型语言模型将疾病传播的实时预测转化为文本推理问题，能够整合实时、复杂、非数值型信息，并在COVID-19大流行中得到应用。该研究揭示了适用大型语言模型和表征学习提升疫情预测的潜力，展示了人工智能创新如何加强未来的疫情应对和危机管理。

Apr, 2024

COVID-19期间报纸文章情感分析的大型语言模型：卫报

在COVID-19期间，对The Guardian报纸的情感分析显示出负面情绪的主导地位，包括悲伤、烦躁、焦虑和否认，与社交媒体情感分析的结果存在差异，表明社交媒体提供了更多样化的情绪反映。

May, 2024

使用大语言模型对COVID-19期间的反华情绪进行纵向情感分析

本研究解决了COVID-19疫情期间因反华情绪加剧而导致的歧视问题，特别是针对华人的不公现象。通过利用大型语言模型（LLMs），我们提出了一种情感分析框架，对社交媒体上的反华情绪进行了纵向分析，发现反华推文的激增与COVID-19病例的增加存在显著相关性。这一发现强调了疫情如何影响公众情感，并指出政治叙述和错误信息对社会舆论的影响。

Aug, 2024