Dec, 2023

利用领域适应和数据增强提高英语和阿拉伯语中古兰经 IR 的效果

TL;DR通过最新的神经信息检索方法,我们研究了如何更高效地处理阿拉伯语和英语的古兰经信息检索问题。通过在大量通用领域数据上进行训练,然后在特定领域数据上继续训练,并采用数据增强技术,我们取得了在 MRR@10 和 NDCG@5 指标上明显改善的成果,为英语和阿拉伯语的古兰经信息检索设立了新的技术标杆。