Aug, 2019
超越只能阅读英语:零样本多语种传递在保加利亚语中的实验
Beyond English-Only Reading Comprehension: Experiments in Zero-Shot Multilingual Transfer for Bulgarian
Momchil Hardalov, Ivan Koychev, Preslav Nakov
TL;DR研究了在英文大规模数据集中预训练的多语言 BERT Fine-Tuning 在保加利亚语阅读理解中的效果,构建了一个新的包含历史、生物、地理和哲学等学科的 12 年级毕业考试和 412 个在线历史测验问题的数据集,并利用不同的索引和预训练策略进行实验,评估结果表明,准确率为 42.23%,大大超过了基线水平 24.89%。