EMNLPOct, 2022

Stanceosaurus:多语言虚假信息立场分类

TL;DRStanceosaurus 为一个包含 28,033 个英语、印地语和阿拉伯语推文的新语料库,对 251 个虚假言论的立场进行了注释,并引入了更为精细的五类标签策略以区分隐含立场,预训练的基于变压器的立场分类器在未见训练数据的其他地区的言论中呈现出良好的泛化性能,语言跨度范围广。此外,该文提供了一种域自适应方法,以进一步提高在 Stanceosaurus 上的表现。