利用GPT进行反事实新闻报道的COVID那个不是
该研究针对COVID-19信息滥用问题,发布了一份包含16000条人工标注推特的数据集,并通过预训练Transformers模型等方法获得了良好的评估结果,以解决多语言、多任务下的信息可信度问题。
Apr, 2020
本文利用GPT-2语言模型,结合tf-idf、BERT、BioBERT、USE四种过滤方法,开发了一款自动回答有关COVID-19的聊天机器人,并通过医学专家评估,发现BERT和BioBERT优于tf-idf和USE,以提供正确、即时、有用的健康数据。同时,还创建了一款用户友好型的互动网络应用程序。
Jun, 2020
为了抗击COVID-19疫情期间社交媒体上的虚假信息,本文提出两种方法,一是fine-tuning transformers-based language models,二是通过influence data cleansing去除危险的训练实例。通过在两个COVID-19虚假新闻测试集上评估模型,我们强调了此任务的模型泛化能力的重要性。最终模型可以达到高性能和模型泛化性能的平衡。
Jan, 2021
通过训练模型可以区分真假COVID-19相关的健康信息,并获得98.64%的高F1分数,该研究排名第二,距离第一名仅有0.05个百分点的微小差距。
Jan, 2021
本文介绍了一种利用已经被 fact-check 过的英文新闻数据集,通过建立一个名为 CrossFake 的深度学习框架来识别汉语低資源下的 COVID-19 虚假信息。经实验结果表明,CrossFake 在跨语言环境下的情况下比其他单语和跨语言虚假信息检测器更有效。
Oct, 2021
本研究利用推特对澳大利亚 COVID-19 病例进行情感分析和话题模型分析,探究社交媒体对疫情预测的作用,结果表明加入社交媒体变量可以改进疫情预测模型的准确性,并发布全球的 MegaGeoCOV 数据集,以帮助更好地理解全球疫情的动态。
Jun, 2022
本研究使用深度学习模型,利用印度Twitter数据集,对COVID-19疫情的第一至第三波进行话题建模,发现官方治理、疫苗接种和疫情管理等是话题重叠的主题,并发现 COVID-19 疫情的政治、社会和经济情况下出现了新问题。研究结果表明,不同时期的主要话题与相应时间段流行的新闻媒体有强烈的定性相关性。该研究还具有扩展到其他国家和地区捕捉COVID-19疫情不同阶段的主要问题的潜力。
Feb, 2023
本文通过对欧洲五个国家的No-Vax 运动相关文章的标题进行人工标记及使用GPT-3.5 的微调和提示工程来推断新闻标题的框架,以研究该主题。研究结果为新闻分类等任务的可行性和GPT-3.5 模型是否能够复制人的感知能力做出贡献。
Apr, 2023
在COVID-19期间,对The Guardian报纸的情感分析显示出负面情绪的主导地位,包括悲伤、烦躁、焦虑和否认,与社交媒体情感分析的结果存在差异,表明社交媒体提供了更多样化的情绪反映。
May, 2024
通过在大规模文本存档上训练深度神经网络,大型语言模型能够学习构成历史和当代话语的复杂语言模式。我们认为,通过使特定社会和文化背景中的受访者能够进行准确模拟,LLMs可以成为社会学研究的有价值工具。应用LLMs,我们重建了2019年的公众舆论格局,以检查COVID-19未来极化在现有政治话语中是否预示。通过在2019年的文本上训练LLMs,我们模拟美国自由派和保守派对一系列与疫情相关的问题的回答。我们发现,在84%的情况下,模拟的回答者再现了观察到的党派间的COVID-19态度差异,显著高于偶然差异。我们发现,观察到的党派差距在很大程度上对应于对自由、安全和机构信任的不同诉求。我们的发现表明,COVID-19的政治化在很大程度上与先前的意识形态格局一致,这一前所未有的事件推动着历史沿着其轨道前进,而不是改变其方向。
May, 2024