Feb, 2023

增强阿拉伯目标意义验证的上下文 - 词汇增强

TL;DR本文介绍了通过 (Arabic-English-Arabic) 机器回译,对 ArabGlossBERT 数据集进行了扩充。结果数据集大小增加到 352K 个对(149K 个正对和 203K 个负对)。我们使用不同的数据配置来微调目标意义验证(TSV)任务,并且测量扩充的影响。虽然我们的方法表现出了与基准线相当的性能,但在某些实验中,也观察到了一些部分词性的改进。