May, 2023

PESTS: 波斯语 - 英语跨语言语义文本相似性语料库

TL;DR本文为首次使用语言专家生成了一个波斯语和英语句子之间语义文本相似性语料库 (PESTS),并使用此数据集微调不同的基于 transformers 的模型,并且结果表明,使用 PESTS 数据集,XLM ROBERTa 模型的 Pearson 相关性从 85.87%提高至 95.62%。