May, 2023

使用 Spark 生态系统的分布式自动领域特定多词术语识别架构

TL;DR提出了一种基于 Spark 的分布式自动领域特定多词术语识别架构,用于提取领域特定的术语,设计了易于集成的 Python 实现,给出了两个真实数据集上的实验结果,证明了架构的可行性。