Sep, 2022

使用 Subword TF-IDF 进行多语言搜索

TL;DR采用子词标记化方法可以实现多语言检索,采用 STF-IDF 方法可以在不依赖启发式预处理的情况下提高信息检索精度,Text2Text 软件开源,可用于多种语言的信息检索。