Mar, 2020

X-Stance: 一个用于立场检测的多语言、多目标数据集

TL;DR利用来自瑞士选举候选人的评论,构建了一个多语言立场检测数据集,包含3种语言的67,000条评论,预先加入自然问题代表目标,并用此训练出一种适用于所有政治问题的单一模型,使用多语言BERT的基线结果表明,该方法在零样本的情况下,进行跨语言和跨目标的转移效果相对成功。