May, 2024

波斯同音词消歧:利用 ParsBERT 提升句子理解力的新词义消歧数据集

TL;DR我们引入了一个新的波斯同音异形词消歧数据集,对各种嵌入进行了全面探索,并通过余弦相似度和分类等下游任务来评估其有效性。我们训练了多种机器学习和深度学习模型进行同音异形词消歧,并在准确度、召回率和 F1 分数等方面对模型的性能进行了细致分析,从而深入了解它们的优势和限制。