MMNov, 2023

使用 R-drop 进行的文本增强以便进行自报 Covid-19 推文分类

TL;DR该研究报告介绍了为 2023 年社交媒体挖掘健康共享任务创建的模型。我们的团队解决了第一个任务,即对自我报告 Covid-19 诊断的推文进行分类。我们的方法使用多样的文本增强和利用 R-drop 来增强数据并减少过拟合,提高模型效果。我们的领先模型通过使用 R-drop 和增强技术(如同义词替换、保留词和回译)超过了任务的平均分数和中位数。我们的系统在测试集上取得了令人印象深刻的 F1 分数为 0.877。