May, 2023

使用 OpenCorpora 中的范式检索提高全文检索词形还原技术

TL;DR本篇论文提出一种革命性的方法,利用 OpenCorpora 数据集和定制的检索算法来放大全文搜索的词形还原。我们的主要目标是简化单词的原型或词形还原的提取,同时我们提出了一种紧凑的字典存储策略,大大提高了词形还原的速度和精度。