Aug, 2019

超越只能阅读英语:零样本多语种传递在保加利亚语中的实验

TL;DR研究了在英文大规模数据集中预训练的多语言 BERT Fine-Tuning 在保加利亚语阅读理解中的效果,构建了一个新的包含历史、生物、地理和哲学等学科的 12 年级毕业考试和 412 个在线历史测验问题的数据集,并利用不同的索引和预训练策略进行实验,评估结果表明,准确率为 42.23%,大大超过了基线水平 24.89%。