Sep, 2023
利用大型语言模型和弱监督进行社交媒体数据标注:使用 COVID-19 自报疫苗推文进行评估
Leveraging Large Language Models and Weak Supervision for Social Media data annotation: an evaluation using COVID-19 self-reported vaccination tweets
Ramya Tekumalla, Juan M. Banda
TL;DR本研究评估了使用大型语言模型(例如 GPT-4)和弱监督来识别 COVID-19 疫苗相关的推文,以与人工注释者的性能进行比较。通过手动筛选的黄金标准数据集,利用 GPT-4 在无须额外微调或指示的情况下提供标签,在单次模式下进行分析。