利用GPT进行反事实新闻报道的COVID那个不是

Oct, 2022

利用GPT进行反事实新闻报道的COVID那个不是

The COVID That Wasn't: Counterfactual Journalism Using GPT

Sil Hamilton, Andrew Piper

TL;DR本文探索了利用大型语言模型评估人类对真实世界事件的解释。为此，我们使用在2020年之前进行训练的语言模型，根据疫情期间实际文章的标题人工生成了有关COVID-19的新闻文章。我们将我们人工生成的语料库的风格特征与新闻语料库进行比较，并发现我们生成的文章在COVID-19方面表现出更为消极的态度，且明显较少涉及地缘政治框架。我们的方法和结果对通过文本生成实现大规模文化进程模拟的研究者来说具有重要意义。

Abstract

In this paper, we explore the use of large language models to assess human interpretations of real world events. To do so, we use a language model trained prior to 2020 to artificially generate news articles concerning

发现论文，激发创造

打击COVID-19信息疫情：从记者、事实核查人员、社交媒体平台、政策制定者和社会人士的角度建模

该研究针对COVID-19信息滥用问题，发布了一份包含16000条人工标注推特的数据集，并通过预训练Transformers模型等方法获得了良好的评估结果，以解决多语言、多任务下的信息可信度问题。

Apr, 2020

COVID-19自动问答任务的语言模型质量评估

本文利用GPT-2语言模型，结合tf-idf、BERT、BioBERT、USE四种过滤方法，开发了一款自动回答有关COVID-19的聊天机器人，并通过医学专家评估，发现BERT和BioBERT优于tf-idf和USE，以提供正确、即时、有用的健康数据。同时，还创建了一款用户友好型的互动网络应用程序。

Jun, 2020

COVID-19假新闻检测模型的泛化能力

为了抗击COVID-19疫情期间社交媒体上的虚假信息，本文提出两种方法，一是fine-tuning transformers-based language models，二是通过influence data cleansing去除危险的训练实例。通过在两个COVID-19虚假新闻测试集上评估模型，我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。

Jan, 2021

社交媒体中的COVID-19虚假新闻识别

通过训练模型可以区分真假COVID-19相关的健康信息，并获得98.64%的高F1分数，该研究排名第二，距离第一名仅有0.05个百分点的微小差距。

Jan, 2021

跨语言COVID-19虚假新闻检测

本文介绍了一种利用已经被 fact-check 过的英文新闻数据集，通过建立一个名为 CrossFake 的深度学习框架来识别汉语低資源下的 COVID-19 虚假信息。经实验结果表明，CrossFake 在跨语言环境下的情况下比其他单语和跨语言虚假信息检测器更有效。

Oct, 2021

Twitter对话预测每日COVID-19确诊病例

本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析，探究社交媒体对疫情预测的作用，结果表明加入社交媒体变量可以改进疫情预测模型的准确性，并发布全球的 MegaGeoCOV 数据集，以帮助更好地理解全球疫情的动态。

Jun, 2022

透过 Twitter 进行 COVID-19 主题建模的深度学习：Alpha、Delta 和 Omicron

本研究使用深度学习模型，利用印度Twitter数据集，对COVID-19疫情的第一至第三波进行话题建模，发现官方治理、疫苗接种和疫情管理等是话题重叠的主题，并发现 COVID-19 疫情的政治、社会和经济情况下出现了新问题。研究结果表明，不同时期的主要话题与相应时间段流行的新闻媒体有强烈的定性相关性。该研究还具有扩展到其他国家和地区捕捉COVID-19疫情不同阶段的主要问题的潜力。

Feb, 2023

新闻框架：从人类感知到大型语言模型推断

本文通过对欧洲五个国家的No-Vax 运动相关文章的标题进行人工标记及使用GPT-3.5 的微调和提示工程来推断新闻标题的框架，以研究该主题。研究结果为新闻分类等任务的可行性和GPT-3.5 模型是否能够复制人的感知能力做出贡献。

Apr, 2023

COVID-19期间报纸文章情感分析的大型语言模型：卫报

在COVID-19期间，对The Guardian报纸的情感分析显示出负面情绪的主导地位，包括悲伤、烦躁、焦虑和否认，与社交媒体情感分析的结果存在差异，表明社交媒体提供了更多样化的情绪反映。

May, 2024

计算社会学：利用大型语言模型预测COVID-19极化

通过在大规模文本存档上训练深度神经网络，大型语言模型能够学习构成历史和当代话语的复杂语言模式。我们认为，通过使特定社会和文化背景中的受访者能够进行准确模拟，LLMs可以成为社会学研究的有价值工具。应用LLMs，我们重建了2019年的公众舆论格局，以检查COVID-19未来极化在现有政治话语中是否预示。通过在2019年的文本上训练LLMs，我们模拟美国自由派和保守派对一系列与疫情相关的问题的回答。我们发现，在84%的情况下，模拟的回答者再现了观察到的党派间的COVID-19态度差异，显著高于偶然差异。我们发现，观察到的党派差距在很大程度上对应于对自由、安全和机构信任的不同诉求。我们的发现表明，COVID-19的政治化在很大程度上与先前的意识形态格局一致，这一前所未有的事件推动着历史沿着其轨道前进，而不是改变其方向。

May, 2024