软实力匹配的表示学习
通过在 6 个统一化技能提取数据集上使用大语言模型(LLMs)的少样本学习能力,我们研究了上下文学习的使用,以克服手动注释数据的高依赖性对这些方法的泛化能力的限制。我们展示了 LLMs 能够更好地处理在技能提取任务中句法复杂的技能提及,尽管在性能上不及传统监督模型。
Feb, 2024
本文提出一种实用的方法来在职位列表中检测技能,该方法将任务视为一个排名问题,通过提取短语并与短语上下文的语义相似性进行排名,并进行技能短语的最终分类,从而在小数据集中比实体识别模型表现更好。
Oct, 2022
通过使用大型语言模型,本研究提出了一种成本有效的方法来生成准确、全合成的技能提取的标签数据集,并提出了一种对比学习策略,证明其在任务中的有效性。在三个技能提取基准测试中,我们的结果显示,与仅依赖于远程监督的字面匹配的先前发布结果相比,R-Precision@5 提高了 15 至 25 个百分点。
Jul, 2023
通过分类框架和深度学习模型,该论文提出一种方法来识别职位要求和横向技能的关联,并预测个体职位描述所需的技能。该方法使用 ESCO(欧洲技能、能力和职业)分类法进行数据收集、预处理和标记。采用分层分类和多标签策略进行技能识别,通过数据平衡增强模型的鲁棒性。通过比较使用英语特定和多语言句子嵌入模型得到的结果,发现它们具有相近的准确性。实验案例研究详细介绍了神经网络配置、超参数和交叉验证结果,突出了分层方法的有效性和多语言模型在多样化欧洲职位市场的适用性。因此,提出了一种新的方法来从职位广告中对横向技能进行分层分类。
Jan, 2024
本文介绍了 Skill Recommendation(SkillRec)系统,它基于职位名称,收集并确定了职位所需的技能集,并通过单词 / 句子嵌入技术和前馈神经网络为职位提供建议。在 6,000 个职位标题和描述的数据集上进行初步实验后,SkillRec 表现出很高的准确性和 F1 分数。
Feb, 2023
该论文关注应用于人力资源领域的深度学习语义搜索算法,旨在开发一种新颖的方法来训练 Siamese 网络以将招聘广告中提到的技能与职位标题关联起来,并通过基于共现信息的语义相似性搜索来找到用于标题标准化的候选人。通过比较 FastText、BERT、SentenceBert 和 JobBert 等基准模型,已经证明了该新方法相对于其他通用文本编码器在准确率上的显著改进,通过 VacancySBERT 和 VacancySBERT(带技能)分别实现了 10% 和 21.5% 的改进,该论文还开发了一个开源的基准模型,以促进该领域的进一步研究。
Jul, 2023
人 - 工作适应对工作满意度和绩效的影响被广泛认可,提供适时的职业发展方向的重要性日益凸显。本文介绍了一种名为 CareerBERT 的新型表示学习方法,用于工作历史数据的职业发展路径预测,并且在结构化数据和文本数据的综合模型上取得了最好的预测效果。
Oct, 2023
本篇论文探讨了近年来自然语言处理在需求工程领域中的应用,通过系统文献综述的方法,发现除了传统的基于词法和句法特征,利用高级嵌入式表示的需求表征在大部分需求工程任务中均表现出很好的效果;但在其他任务中,基于词法和句法特征的表征仍然更为适用。同时,本文也指出了未来的研究方向和更深入探讨的问题。
May, 2022
近年来,自然语言处理(NLP)取得了显著进展,使得计算机行业市场分析领域有了快速发展。本调查旨在提供深度学习方法、数据集和特定于 NLP 驱动的技能提取和分类的术语的全面概述,填补这一新兴领域的不完全评估。我们对公开可用数据集的详细分类解决了关于数据集创建和特征的信息缺乏的问题。最后,对术语的关注解决了目前对重要概念(如硬技能和软技能)和技能提取和分类相关术语缺乏一致定义的问题。
Feb, 2024