EMNLPJan, 2023

CASE-2022 多语言抗议活动检测任务中的 ClassBases 模型:多语言抗议新闻检测和自动复制手动创建的事件数据集

TL;DR该研究报告描述了作者参加多语言抗议事件检测的共享任务中的 ClassBases 的提交。作者使用 XLM-RoBERTa-base、mLUKE-base 和 XLM-RoBERTa-large 进行微调来进行文件分类、句子分类和标记分类。通过训练多语言模型和使用实体知识,研究者们发现大模型似乎效果更好,但代价也更高。