Jul, 2023

通过潜在狄利克雷分配和自然语言处理进行简历评估以实现有效的候选人选择

TL;DR我们提出了一种使用潜在狄利克雷分配(LDA)和 SpaCy 中的实体检测进行简历评分的方法。该方法首先使用 SpaCy 的命名实体识别(NER)从简历中提取相关实体,例如教育、经验和技能。然后,LDA 模型使用这些实体为简历评分,为每个实体分配主题概率。此外,我们对 SpaCy 的 NER 进行了详细的实体检测分析,并报告了其评估指标。使用 LDA,我们的系统将简历分解为潜在主题并提取有意义的语义表示。为了更加注重简历内容而非结构和关键词匹配,我们的模型在仅考虑技能时的准确率达到了 77%,在考虑所有属性时的整体准确率达到了 82%(如大学名称、工作经验、学位和技能)。