May, 2024

计算社会学:利用大型语言模型预测COVID-19极化

TL;DR通过在大规模文本存档上训练深度神经网络,大型语言模型能够学习构成历史和当代话语的复杂语言模式。我们认为,通过使特定社会和文化背景中的受访者能够进行准确模拟,LLMs可以成为社会学研究的有价值工具。应用LLMs,我们重建了2019年的公众舆论格局,以检查COVID-19未来极化在现有政治话语中是否预示。通过在2019年的文本上训练LLMs,我们模拟美国自由派和保守派对一系列与疫情相关的问题的回答。我们发现,在84%的情况下,模拟的回答者再现了观察到的党派间的COVID-19态度差异,显著高于偶然差异。我们发现,观察到的党派差距在很大程度上对应于对自由、安全和机构信任的不同诉求。我们的发现表明,COVID-19的政治化在很大程度上与先前的意识形态格局一致,这一前所未有的事件推动着历史沿着其轨道前进,而不是改变其方向。